KOLLOQUIUM FREMDSPRACHENUNTERRICHT 51 


Daniela Elsner / Britta Viebrock (Hrsg.) 


Triangulation in der 
Fremdsprachenforschung 


n | 
si 


Nr P 


Kolloquium © 
Fremdsprachenunterricht 


pg ETER LANG 
EDITION 


KOLLOQUIUM FREMDSPRACHENUNTERRICHT 51 


Daniela Elsner / Britta Viebrock (Hrsg.) 


Triangulation in der Fremdsprachenforschung 


Fremdsprachenlernen und Fremd- 
sprachenunterricht sind facettenreiche 
Forschungsgegenstände, deren Untersu- 
chung ein komplexes Design verlangt. Um 
ein multidimensionales Bild der ablaufen- 
den Prozesse zu erhalten, werden in der 
fremdsprachlichen Unterrichtsforschung 
immer häufiger rekonstruktive und inter- 
pretative Verfahren mit standardisierten 
quantitativen Methoden verbunden. Me- 
thoden-, Theorie-, Daten- oder Beobach- 
tertriangulation werden zur Überprüfung 
von Forschungsergebnissen sowie zur 
Erweiterung von Erkenntnismöglich- 
keiten eingesetzt. Die Beiträge in die- 

sem Band zeigen die unterschiedlichen 
Dimensionen des Triangulationskonzepts, 
seine theoretischen Grundlagen sowie 
praktische Anwendungen. Sie sind im 
Anschluss an die zweite forschungsme- 


thodische Sommerschule der Deutschen 
Gesellschaft für Fremdsprachenforschung 
(DGFF) entstanden. 
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Einleitung: Triangulation in der 
Fremdsprachenforschung 


Daniela Elsner / Britta Viebrock 


Der Weg zu neuen Modellen und Konzepten im Fremdsprachenunterricht 
erschließt sich im Optimalfall über eine Verzahnung theoretischer Analysen, 
systematischer Beobachtungen und empirischer Untersuchungen im Praxis- 
feld. Dabei stellt sich für alle drei Herangehensweisen die Frage nach geeigne- 
ten Methoden, die den jeweiligen Gegenstand in angemessener Art und Weise 
beleuchten können. Gerade in Deutschland zeichnete sich im Kontext empiri- 
scher Herangehensweisen lange Zeit die Tendenz ab, qualitative und quantita- 
tive Erhebungsmethoden strikt voneinander zu trennen. In jüngster Zeit lassen 
sich jedoch immer häufiger Arbeiten finden, welche die Grenzen zwischen den 
unterschiedlichen Forschungsparadigmen überwinden und im Sinne einer 
Methoden-, Theorie-, Daten- oder Beobachtertriangulation die Vorteile unter- 
schiedlicher Herangehensweisen durch integrative Verfahren vereinen. Dieser 
einleitende Beitrag gibt einen kurzen Überblick über traditionelle und jüngere 
Sichtweisen diesbezüglich sowie eine Vorschau auf die in diesem Band vereinten 
Beiträge, die sich mit dem Thema Triangulation in der Fremdsprachenforschung 
theoretisch auseinandersetzen oder diese praktisch anwenden. 


1. Die Wahl der Methode: Qualitativ, quantitativ oder beides? 


Methodology is one of the most basic questions for any discipline dealing with human 
interaction. Language learning and the acquisition of the rules for appropriate speech 
behavior are no exception. The questions of what constitutes data and how we treat data 
are fundamental to the entire enterprise of explaining and describing the acquisition of 
a second language. (Wolfson 1986: 689) 


Die Festlegung des methodischen Vorgehens wird auch in der fremdsprachen- 
didaktischen Forschung primär von der Ontologie der jeweiligen Fragestellung 
bestimmt. So verweist Grotjahn (2003: 493) darauf, dass Forschungsmethoden 
dem jeweiligen Gegenstand angemessen sein sollen. Der Forschungsgegenstand 
„Fremdsprachenunterricht“ weist dabei - in Abgrenzung zu anderen Forschungs- 
bereichen - eine Reihe von spezifischen Aspekten auf, welche vom Forscher! 


1 In den Beiträgen dieses Bandes werden maskuline und feminine Formen in un- 
terschiedlicher Weise verwendet. Unter der Voraussetzung, dass jeweils beide 


8 Daniela Elsner / Britta Viebrock 


berücksichtigt werden müssen. So zeigen die fremdsprachlichen Interaktionen 
im Unterricht ganz besondere Eigenschaften, wie z.B. ein hoher Sprechanteil der 
Lehrkräfte, häufige Fehlerkorrektur, Code-Switching etc. auf, die in dieser Art in 
anderen Forschungsfeldern nicht wiederzufinden sind und deren wissenschaft- 
liche Analyse eine sorgsame Auswahl einer oder mehrerer Forschungsmethoden 
bedarf. 

In der Sozialforschung konkurrieren eine Vielzahl von miteinander nicht 
oder lediglich partiell kompatiblen Theorien zur Methodologie, welche auch in 
die fremdsprachliche Unterrichtsforschung Eingang finden. Die Unterscheidung 
von qualitativer und quantitativer bzw. rekonstruktiver und Hypothesen testen- 
der Forschung (Bonnet 2009) scheint dabei eine übergeordnete Rolle zu spielen: 
Während das qualitative Forschungsparadigma eine holistische Betrachtung der 
Realität zugrunde legt, indem alle sich möglicherweise auf den Forschungsgegen- 
stand auswirkenden Einflussfaktoren mit einbezogen werden, wird in quantitati- 
ven Ansätzen versucht, die Anzahl dieser Faktoren möglichst gering zu halten und 
den Untersuchungsgegenstand weitgehend zu kontrollieren. Die schriftliche bzw. 
mündliche Datenerhebung findet dabei mittels ausgewählter Instrumente in ein- 
maligen „Überprüfungssituationen“ statt. Quantitative Forschungsdesigns über- 
prüfen vorab formulierte Hypothesen mittels einer großen Anzahl an Probanden. 
Qualitative Untersuchungen sind dagegen Hypothesen generierend, explorativ, 
rekonstruktiv und häufig in Longitudinalstudien angelegt. In der quantitativen 
Forschung wird der Unabhängigkeit des Beobachters vom Forschungsgegenstand 
ein zentraler Stellenwert eingeräumt. Qualitative Forschung greift dagegen auf die 
methodisch kontrollierte, subjektive Wahrnehmung des Forschers als Bestandteil 
der Erkenntnisgewinnung zurück (vgl. z.B. Flick et al. 2003: 24f.). 

Jenseits der Debatten, in denen sich beide Forschungsrichtungen wechselsei- 
tig die wissenschaftliche Legitimation absprechen, muss vom Forscher zunächst 
überlegt werden, für welche Fragestellung und für welchen Forschungsgegen- 
stand qualitative oder quantitative Forschung jeweils angemessener erscheint. 
Quantitative Methoden messen zählbare Eigenschaften. Die häufigsten Metho- 
den der quantitativen Datenerhebung sind die Befragung, die Beobachtung, das 
Experiment, physiologische Messungen sowie der Test (vgl. Bortz/Döring 2002). 
Quantitative Verfahren sind für ihre vergleichend-statistische Auswertung auf 
ein hohes Maß an Standardisierung der Datenerhebung angewiesen. Der Vorteil 


Geschlechter gemeint sind, haben wir uns entschieden, diese Vielfalt bestehen zu las- 
sen. Wir fühlen uns den Leitprinzipien des gender mainstreaming verpflichtet, sehen 
sie jedoch nicht notwendigerweise dadurch eingelöst, dass jeder maskulinen Form 
noch ein „/-innen“ beigefügt wird. 
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quantitativer Methoden liegt darin, dass sich die Messergebnisse mit algebrai- 
schen (Addition, Multiplikation) beziehungsweise den darauf basierenden sto- 
chastischen Methoden (Mittelwert, Varianz, etc.) weiterverarbeiten lassen. So ist 
es möglich, statistische Tests durchzuführen und Hypothesen zu prüfen sowie 
deren Signifikanz zu berechnen. Explorativ lassen sich Daten zudem mittels Fak- 
torenanalyse oder CJusteranalyse auswerten (vgl. Elsner/Wildemann 2010). 

Lange Zeit stand die qualitative Sozialforschung den Erhebungsmethoden der 
quantitativen Forschung sehr kritisch gegenüber. Insbesondere die Künstlichkeit der 
Erhebungssituation, eine mangelnde Offenheit und die Nichtberücksichtigung sozi- 
aler Phänomene wurden als Defizite standardisierter Verfahren angesehen. Quali- 
tative Forschung versucht hingegen, Soziales tiefgründiger zu erforschen und nicht 
direkt sichtbare Sinnstrukturen herauszuarbeiten. Die damit einhergehenden Ver- 
fahren lassen sich stärker dem Einzelfall anpassen und sind damit in Bezug auf die 
Erhebung individueller Verläufe wesentlich flexibler. Zu den häufigsten qualitativen 
Methoden der Datenerhebung zählen die schriftliche und mündliche Befragung so- 
wie die qualitative Beobachtung. Qualitative Verfahren sind immer dort zu empfeh- 
len, wo es um die Erschließung eines bisher wenig erforschten Wirklichkeitsbereichs 
mithilfe von sensibilisierenden Konzepten geht (vgl. Flick et al. 2003: 25). 

Obwohl insbesondere in der deutschen Forschungslandschaft lange Zeit 
eine starke Tendenz vorherrschte, qualitative und quantitative Methoden zwei 
unterschiedlichen Paradigmen zuzuordnen (vgl. z.B. Kelle/Erzberger 2003: 299), 
scheint sich die Grenze zwischen diesen beiden Methoden mittlerweile aufzu- 
lösen. So versuchen zahlreiche Arbeiten methodologische und methodische 
Grundlagen für eine Integration beider Ansätze zu entwickeln. Sie verfolgen da- 
bei im Wesentlichen zwei Zielvorstellungen: (a) eine Perspektivenerweiterung 
oder (b) eine Ergebnisvalidierung. Während das Ziel einer Perspektivenerwei- 
terung grundsätzlich mit der Forderung nach der Gegenstandsangemessenheit 
der Methode vereinbar ist, lassen sich bezüglich der Methodenintegration als 
Validierungsstrategie auch kritische Positionen finden: 


Der Gegenstand nimmt [...] unterschiedliche Gestalt an, je nachdem ob er in Form ei- 
nes Beobachtungsprotokolls, eines Transkriptes oder eines aufgezeichneten Interviews 
vorliegt, was darauf hindeutet, dass eine durchgängige Gegenstandskonstruktion durch 
die jeweilige Spezifik der Methode entsteht. (Helsper et al. 2001: 257) 


Diese Sichtweise beinhalte zugleich eine fundamentale Kritik an Verfahren, bei 
denen Ergebnisse, die mithilfe einer Forschungsmethode erzeugt werden, durch 
solche, die mithilfe einer anderen hervorgebracht werden, validiert werden. Im 
strengen Sinne werden hierbei niemals die gleichen Gestalten des Gegenstands 
zueinander in Beziehung gesetzt (vgl. Viebrock 2007: 34£.). Teilt man diese Kritik, 
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ist die Zielvorstellung der Ergebnisvalidierung ausgeschlossen. Der Wert eines 
integrativen Verfahrens zur Perspektivenerweiterung bleibt von der Kritik aller- 
dings unbenommen. 


2. Beispiele methodischer Triangulation im Kontext 
fremdsprachlicher Unterrichtsforschung 


Die kombinierte Verwendung zweier oder mehrerer Methoden wird im Kontext 
der empirischen Sozial- und Geisteswissenschaften als integrativer Ansatz (Sei- 
pel/Rieker 2003), mixed methods approach (Jick 1979) oder Triangulation (Flick 
2011) bezeichnet. In Anlehnung an Denzin (1970) und andere lassen sich fol- 
gende vier Formen der Triangulation unterscheiden: 


e Datentriangulation: Kombination und Nutzung mehrerer Datenquellen, die 
zu unterschiedlichen Zeiten und Orten sowie an verschiedenen Personen er- 
hoben werden. 

e Beobachtertriangulation: Datenerhebung und -analyse verschiedene For- 
scher bzw. Beobachter, um möglichen subjektiven Einflüssen in der Interpre- 
tation entgegenzuwirken. 

e Theorie-Triangulation: Anwendung unterschiedlicher Theorien auf densel- 
ben Forschungsgegenstand. 

e Methodentriangulation: Diese kann sowohl in Form der Verwendung ver- 
schiedener Skalierungsverfahren innerhalb einer Methode bzw. eines Mess- 
instruments (within-method) erfolgen, als auch im Einsatz verschiedener 
Methoden bei der Datengewinnung zu einem Untersuchungsgegenstand be- 
stehen (between-method). 


Das generelle Anliegen dieser Forschungsvarianten besteht darin, die besonde- 
ren Stärken und Potenziale der gewählten Methoden bzw. Daten in gegenseitiger 
Ergänzung nutzbar zu machen und die Schwächen zu kompensieren: „Dabei 
verlagert sich insgesamt der Fokus von der ursprünglichen Orientierung an der 
Überprüfung von Ergebnissen [...] zugunsten einer stärkeren Betonung der sys- 
tematischen Erweiterung der Erkenntnismöglichkeiten“ (Flick 2011: 26). 

Das hierzu, nicht nur im Kontext der Unterrichtsforschung, häufig eingesetz- 
te, klassische Phasenmodell einer sequenziellen Verbindung von qualitativen 
und quantitativen Methoden ist üblicherweise mit der Ambition verbunden, in 
einem ersten Schritt das Potenzial qualitativer Verfahren für die Exploration des 
Untersuchungsfelds und die Entwicklung von Instrumenten bzw. Hypothesen zu 
nutzen, um dann in einem zweiten Schritt mithilfe quantitativer Methoden prä- 
zise Messungen durchzuführen und auf der Grundlage einer umfangreicheren 
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Datenbasis geeignete statistische Analysen vorzunehmen (vgl. Barton/Lazarsfeld 
1979, Kelle/Erzberger 2003). 

In der fremdsprachlichen Unterrichtsforschung werden immer häufiger in- 
terpretative qualitative Verfahren mit standardisierten quantitativen Methoden 
zu gemeinsamen Untersuchungsdesigns verbunden in der Hoffnung, ein mul- 
tidimensionales Bild der im Unterricht ablaufenden Prozesse zu erhalten und 
diese langfristig verändern zu können. Forschung geschieht somit nicht zum 
Selbstzweck, sondern findet stets zweckgerichtet statt. So versuchte die 2006 
abgeschlossene DESI-Studie (Deutsches Institut für Internationale Pädagogi- 
sche Forschung - DIPF 2006) ebenso wie die im Jahr 2009 veröffentlichte EVE- 
NING-Studie (Engel et al. 2009) oder die vom Institut zur Qualitätsentwicklung 
im Bildungswesen (IQB) bundesweit durchgeführte Ländervergleichsstudie 
(vgl. Köller et al. 2010), mit variierenden Forschungsmethoden unterrichtliche 
Bedingungsfaktoren für sprachliche und kulturelle Lernfortschritte zu identi- 
fizieren. Die Auswertung erfolgte sowohl auf der Basis der im Sinne der Me- 
thodentriangulation erhobenen Ergebnisse von standardisierten Leistungstests 
und/oder Unterrichtsbeobachtungen in Form von Videografien als auch auf der 
Grundlage von Befragungen aller am Unterricht Beteiligten. Darüber hinaus 
wurden die bundesweiten Erhebungen sprachlicher Leistungen im Deutschen 
(als Muttersprache) und im Englischen (als Fremdsprache) (DESI und Länder- 
vergleich) ebenso wie die bundeslandinterne EVENING-Evaluation interdis- 
ziplinär angelegt (Fachdidaktiker, Soziologen, Pädagogen, Psychologen); man 
setzte somit nicht nur auf theoretische und methodische Triangulation, son- 
dern auch auf Forscher- bzw. Beobachtertriangulation. Langfristiges Ziel dieser 
kaleidoskopartigen Bestandsaufnahmen ist es, die Lernbedingungen und somit 
die Qualität des fremdsprachlichen Unterrichts auf allen Ebenen zu verbessern. 


3. Zum Aufbau und zu den Beiträgen dieses Bandes 


Die Beiträge in diesem Band bilden die unterschiedlichen Dimensionen des 
Triangulationskonzepts aus der Perspektive der Fremdsprachenforschung ab. 
Sie sind im Anschluss an die zweite forschungsmethodische Soemmerschule der 
Deutschen Gesellschaft für Fremdsprachenforschung (DGFF) ausgearbeitet 
worden. Die fundierte methodische Ausbildung von Nachwuchsforscherinnen 
und -forschern gehört zu den zentralen Zielsetzungen der DGFF, die mit der 
Sommerschule zu diesem Zweck ein spezifisches Förderprogramm aufgelegt 
hat. Den Überblicksbeiträgen etablierter Wissenschaftlerinnen und Wissen- 
schaftler haben wir jeweils einen Anwendungsbeitrag zur Seite gestellt, in dem 
eine Nachwuchsforscherin bzw. ein Nachwuchsforscher ihr bzw. sein laufendes 
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Forschungsprojekt, d.h. Fragen des Designs, methodische Entscheidungen und 
erste Ergebnisse diskutiert. 

In Anlehnung an die weit verbreitete Reklame eines bekannten Einrichtungs- 
hauses, das mit seinen Möbeln nicht nur zweckmäßige und alltagstaugliche Ge- 
genstände, sondern ein umfassendes, modernes Lebensgefühl verkaufen will, 
stellt Julia Settinieri in ihrem Beitrag „Forschst Du noch, oder triangulierst Du 
schon?“ einleitend Überlegungen an, ob Triangulation in der Fremdsprachen- 
forschung bereits unverzichtbar ist, wenigstens aber zum guten Ton gehört. In 
ihrem Überblicksbeitrag zeichnet sie die Genese des Konzepts und seiner un- 
terschiedlichen Ausprägungen nach. Sie zeigt anhand spezifischer Beispiele aus 
der Fremdsprachenforschung auf, in welcher Weise sich Triangulationsstrategi- 
en innerhalb eines Forschungsparadigmas oder übergreifend sinnvoll einsetzen 
lassen, berücksichtigt allerdings auch die Frage, inwieweit es sich dabei um eine 
kritisch zu reflektierende „Modeerscheinung“ handelt. 

Sonja Brunsmeier diskutiert in ihrem Praxisbeitrag ein auf Triangulation 
basierendes Forschungsdesign zur Frage, wie sich die Entwicklung der in den 
Bildungsstandards verankerten Interkulturellen Kommunikativen Kompetenz 
(in Anlehnung an Byram 1997) im Englischunterricht der Grundschule un- 
tersuchen lässt. Während das Konzept für die weiterführenden Schulen bereits 
ausgearbeitet ist und Eingang in Forschungsarbeiten gefunden hat (z.B. im Rah- 
men der DESI-Studie durch Göbel 2007), sind für das frühe Fremdsprachenler- 
nen noch konzeptionelle und methodische Überlegungen zur Anbahnung von 
IKK zu leisten, entsprechende Aufgaben zu entwickeln und einer empirischen 
Überprüfung zu unterziehen. Mithilfe eines komplexen Designs versucht Sonja 
Brunsmeier, die Perspektiven der unterschiedlichen Akteure zu erhellen. 

Die videogestützte Unterrichtsforschung steht im Zentrum des Beitrags von 
Johannes Appel und Udo Rauin, die sich die neueren technischen Möglichkei- 
ten zur Weiterentwicklung des methodischen Repertoires zur Erforschung von 
Lehr- und Lernprozessen zunutze machen. Neben einem Überblick über die 
Grundsätze videographischer Verfahren in der Unterrichtsforschung werden 
Datenbeispiele aus einem Forschungsprojekt zur Schülerbeteiligung und zum 
Engagement im Englischunterricht vorgestellt, um die Analyseschritte (Rating 
bzw. Kodierung) zu unterschiedlichen Aspekten (Qualität des Unterrichts, 
Sprechanteile, unterrichtliche Sozialformen, Beteiligungsverhalten) transparent 
zu machen. Die Autoren zeigen auf, dass sich Videodaten insbesondere zur Da- 
tentriangulation und zur Methodentriangulation (within-method) eignen. 

Im zugehörigen Praxisbeitrag zeigt Heidi Seifert sehr überzeugend, wie sich 
„Videografie als Instrument zur Erforschung von Interaktionsprozessen im Ele- 
mentarbereich“ einsetzen lässt und welche spezifischen Planungsschritte dafür 
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nötig sind. In einer bilingualen (deutsch-englischen) Kindertagesstätte untersucht 
die Verfasserin die sprachlichen Besonderheiten der Erzieherin-Kind-Interaktio- 
nen und diskutiert Aspekte der Vorbereitung und Durchführung der Datenerhe- 
bung. Im Mittelpunkt der Ausführungen stehen die Entwicklung und Reflexion 
eines geeigneten Aufnahmekonzepts ebenso wie datenrechtliche Überlegungen. 
Erste Ausblicke auf den Analyseprozess werden darüber hinaus gegeben. 

Wie sich die Strategie der Triangulation mithilfe qualitativer Forschungs- 
software verfolgen und unterstützen lässt, ist Thema des Grundsatzbeitrags 
von Claus Stefer. Anhand der Software MAXQDA 11 erörtert der Verfasser mit 
großem Praxisbezug das Potenzial moderner Analyseprogramme, große Daten- 
mengen systematisch zu verwalten und unterschiedliche Forschungsmethoden 
zu integrieren. Nach der Darstellung einiger Grundsatzüberlegungen zur Tri- 
angulation erläutert der Verfasser einzelne Verfahrensschritte (Codierungen, 
Verteilungshäufigkeiten von Variablen, Joint Displays, Intercoder-Übereinstim- 
mung) und ihre Umsetzung in der Software. Zahlreiche Screenshots illustrieren 
die Arbeitsweise des Programms. 

Der zugehörige Praxisbeitrag „Are you good at reading? Zur Diagnose- 
kompetenz von Englischlehrkräften“ von Laura Armbrust verdeutlicht, wie die 
qualitative Inhaltsanalyse sowie die Auswertungssoftware in einem fremdspra- 
chendidaktischen Forschungsvorhaben zur Anwendung kommen. Insbesondere 
die wenig zufriedenstellenden Leistungen deutscher Schülerinnen und Schüler 
in den großen Bildungsstudien haben die diagnostischen Kompetenzen der 
Lehrkräfte auch mit Blick auf die rezeptiven Fertigkeiten in den Mittelpunkt des 
Interesses gerückt. Anhand der Daten einer fokussierten Interviewstudie, die 
von der Verfasserin als within-method Triangulation konzipiert wird, werden 
systematisch die Verfahrensschritte des Auswertungsprozesses aufgezeigt. 

Der Grundsatzbeitrag „Analyse qualitativer und quantitativer Befragungsda- 
ten mit SPSS“ von Astrid Jurecka nähert sich dem Thema Triangulation aus der 
Perspektive zweier prototypischer Methoden zur Befragung: dem Interview und 
dem Fragebogen. Die erstgenannte wird üblicherweise dem qualitativen Paradig- 
ma zugeordnet, die letztgenannte dem quantitativen. Neben einer Darstellung der 
klassischen Verwendungsformen beider Methoden richtet die Verfasserin ihren 
Blick insbesondere auf die Möglichkeiten der Quantifizierung qualitativer Daten. 
Anhand von Beispielen aus der Fremdsprachenforschung zeigt sie zudem auf, 
welche Berechnungen mit diesen Daten mittels der Software SPSS möglich sind. 

Der zugehörige Praxisbeitrag von Sara Dallinger und Kathrin Jonkmann 
stellt eine Längsschnittstudie zum bilingualen (deutsch-englischen) Geschichts- 
unterricht vor: „Competencies and Motivation in the Bilingual History Class- 
room (COMBIH)“, in der zu zwei Messzeitpunkten quantitativ orientierte 
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Erhebungsinstrumente (Kompetenztests, Fragebögen) eingesetzt werden. Im 
Zentrum der Überlegungen der Verfasserinnen steht die Frage, welche triangu- 
lativen Optionen sich aus ihren Datensätzen ergeben. Sie zeigen, wie sich mithil- 
fe von Forscher- und insbesondere Datentriangulation sowohl die Strategie der 
Validierung als auch die Strategie der Perspektivenerweiterung verfolgen lässt. 

Der abschließende Beitrag von Karin Aguado zeigt die Grenzen von Triangu- 
lationsstrategien auf und weist auf zahlreiche kritische Punkte hin, die es bei der 
Planung und Durchführung von triangulativ angelegten Forschungsvorhaben ab- 
zuwägen gilt. Im Zentrum der Argumentation dieses Beitrags steht die Annahme, 
dass das methodische Design eines jeden Forschungsprojekts zunächst aus der Ge- 
genstandsangemessenheit der gewählten Methode(n) zu begründen ist. Diese wird 
nicht per defintionem durch den Ansatz der Triangulation erhöht, welcher auch 
nach Ansicht von Karin Aguado gelegentlich Gefahr läuft, zu einer „Modeerschei- 
nung“ zu degenerieren. Allerdings liegen in den Anforderungen, die eine fundierte 
Triangulationsstrategie mit sich bringt, gerade für die Fremdsprachenforschung 
besondere Potenziale, kooperative Vorhaben umzusetzen und kollektive Daten- 
banken anzulegen, welche von einer größeren Anzahl von Forscherinnen und For- 
schern systematisch genutzt werden können und somit einen deutlich sichtbareren 
Beitrag zur Entwicklung der Forschungsleistungen der Disziplin liefern. 

Mit dem abschließenden Beitrag, der gezielt auch eine kritische Sicht der zu- 
vor recht positiv dargestellten Potenziale von Triangulation aufgreift, wird der 
Band in seinen unterschiedlichen Perspektiven abgerundet: Neben den Mög- 
lichkeiten, die mit der Triangulation verbunden sind, den Ausprägungen, mit 
denen sie umgesetzt werden kann, den Ansprüchen, denen sie genügen muss, 
den praktischen Entscheidungen, die zu erwägen sind, werden auch Schwierig- 
keiten und Einschränkungen nicht verschwiegen. Mit dieser Ausrichtung ver- 
binden wir die Hoffnung, Wissenschaftlerinnen und Wissenschaftlern sowie 
insbesondere Nachwuchskräften einen differenzierten Reflexionsrahmen zur 
Verfügung zu stellen, der für die Planung neuer Forschungsdesigns zahlreiche 
Argumente zur Verfügung stellt. 
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Forschst Du noch, oder triangulierst Du schon? 


Julia Settinieri 


Die Forschungsstrategie der Triangulation wird aktuell sehr facettenreich 
diskutiert. Der vorliegende Beitrag zeichnet zentrale Diskussionslinien 
nach, wobei schwerpunktmäßig auf mögliche Zielsetzungen und Formen, 
Forschungsparadigmen übergreifende Triangulation sowie ausgewählte for- 
schungspraktische Probleme eingegangen wird. Argumentiert wird, dass der 
nicht zu unterschätzende Mehraufwand, der durch den Einsatz triangulativer 
Strategien zwangsläufig entsteht, sich lohnt, wenn Gegenstandsangemessen- 
heit und Messgüte jedes einzelnen Datensatzes gewährleistet sind und eine 
explizit begründete sowie möglichst tiefgreifende Integration der einzelnen 
Datensätze gelingt. 


1. Einleitung 


Triangulation ist in den zwei vergangenen Jahrzehnten in der Sozialforschung 
und in den letzten Jahren nun auch in der Sprachlehr- und -lernforschung als 
eine Art Modeerscheinung stark in den Fokus der Fachdiskussion getreten (vgl. 
bereits Aguado/Riemer 2001: 246). Dabei wirkt das Konzept einerseits schillernd 
und gleichzeitig seltsam diffus und wird wohl häufiger diskutiert als tatsäch- 
lich angewandt, worauf auch die ILMES-Definition des Begriffs Triangulation 
hindeutet: 


In der empirischen Sozialforschung: Die Betrachtung eines Gegenstandes aus (nimmt 
man den Begriff wörtlich) zwei oder (im übertragenen Sinn) mehreren Perspektiven, 
Blickrichtungen, Standpunkten. Vor allem im Bereich der qualitativen Forschung wird 
dieses Verfahren immer wieder propagiert und gelegentlich sogar eingesetzt. (ILMES o. J., 
Hervorhebung J. S.). 


Ziel dieses Aufsatzes ist es daher, einen Überblick über Auffassungen und For- 
men von Triangulation zu geben, um davon ausgehend zu diskutieren, wann 
der Einsatz triangulativer Forschungsformen sinnvoll sein kann und wann nicht. 
Der Beitrag gliedert sich in sieben Abschnitte: Im Anschluss an Einleitung und 
Klärung grundlegender Begriffe werden unterschiedliche Formen von Trian- 
gulation, auch Paradigmen übergreifend, diskutiert, um eine Gesamttypologie 
des Triangulationsbegriffs abzuleiten. Nach der Diskussion einiger mit Triangu- 
lation verbundener Praxisprobleme wird abschließend ein die vorangehenden 
Überlegungen zusammenführendes Fazit gezogen. 
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2. Definition, Begriffsgeschichte und Zielsetzungen 


Ursprünglich wurde die Triangulationsmetapher aus den Fachgebieten der 
Navigation und der Landvermessung entlehnt (Kelle/Erzberger 2004: 302), wie 
Brown und Rodgers anschaulich erläutern: 


In surveying and navigation, one determines the position of an object by measuring 
the angles of observation to this object from two points of already known positions. 
In the social sciences, triangulation refers to the attempt to understand some aspect of 
human behavior by studying it from more than one standpoint [...]. (Brown/Rodgers 
2002: 243) 


Diese Grundidee kann jedoch nicht in ihrer Gänze auf die Sozialwissenschaf- 
ten übertragen werden. Während beispielsweise in der Navigation das Ziel 
von Triangulation darin besteht, den Standort eines Schiffs im Koordinaten- 
system durch das Anpeilen des Schiffs von mehreren bekannten Positionen 
aus zu bestätigen, also quasi mehrfach exakt dasselbe zu messen, muss Tri- 
angulation in den Sozialwissenschaften nicht unbedingt auf dasselbe zielen, 
sondern kann auch gerade auf unterschiedliche Aspekte eines Gegenstands 
abheben. 


Die „Berechnung der Position eines Ortes durch die Messung von unterschiedlichen 
Punkten aus“ kann hier bedeuten, 


1. dass mit verschiedenen Methoden dasselbe soziale Phänomen erfasst wird oder 

2. dass hiermit unterschiedliche Aspekte desselben Phänomens oder sogar unterschiedli- 
che Phänomene erfasst werden, deren Abbildungen sich allenfalls zu einem einheit- 
lichen Bild ergänzen. 


Diese Unterscheidung ist keineswegs ein sprachlicher Kunstgriff; denn nur dann, wenn 
sich verschiedene Methoden auf denselben Gegenstand beziehen, können sie zur wech- 
selseitigen Validierung ihrer Ergebnisse eingesetzt werden. Wenn dagegen verschiedene 
Methoden verschiedene Aspekte desselben Gegenstandes oder auch unterschiedliche 
Gegenstände erfassen, so sind unterschiedliche Ergebnisse natürlich zu erwarten, ohne 
dass dies den Schluss auf deren fehlende Validität erlaubt. (Kelle/Erzberger 2004: 303, 
Hervorhebung im Original) 


In den Sozialwissenschaften lassen sich somit im Rahmen triangulativer Designs 
zwei ganz unterschiedliche Zielsetzungen verfolgen: Einerseits kann nach Glei- 
chem gesucht werden, um die Validität von Forschungsergebnissen zu bestätigen; 
andererseits kann aber auch nach ganz unterschiedlichen, einander ergänzen- 
den Informationen gesucht werden, um ein vollständigeres Gesamtbild eines 
Forschungsgegenstands zu zeichnen (vgl. auch Dörnyei 2007: 164-166). Beide 
Zielsetzungen sind legitim, haben sich forschungsgeschichtlich jedoch nachein- 
ander entwickelt (vgl. Johnson/Onwuegbuzie 2004, Johnson et al. 2007, Aguado 
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2014, für einen forschungshistorischen Einblick), wobei sich der Schwerpunkt 
triangulativer Forschung verschoben hat. Ursprünglich im Rahmen quantitati- 
ver Forschung entwickelt, sollte das Triangulationskonzept dazu beitragen, die 
Beeinflussung von Forschungsergebnissen durch das jeweilige Messinstrument 
durch den Einsatz mehrerer Messinstrumente zu relativieren und so die Validität 
der Ergebnisse zu steigern (Reaktivität von Messungen; vgl. genauer z.B. Lam- 
nek 2005: 276-278). Auch Denzin (1970), der für die Verbindung quantitativer 
und qualitativer Methoden plädiert, tut dies ursprünglich mit dem Ziel ihrer 
gegenseitigen Validierung. Diskutiert werden im Vorfeld dieser Grundlagenpu- 
blikation zur Triangulation bereits der Ansatz der multitrait-multimethod matrix 
(Campbell/Fiske 1959) und der Einsatz sog. non-reaktiver Verfahren, letzteres 
auch schon unter dem Begriff der Triangulation (Webb et al. 1966). Erst ab den 
1980er Jahren wird stärker betont, dass Triangulation weniger zur Validierung 
als zur gegenseitigen Ergänzung von Forschungsansätzen sinnvoll sein könnte 
(Fielding/Fielding 1986), und zwar unter Rückgriff auf das gleiche Argument: 
Wenn die Methode den Gegenstand konstituiert, ist es schlicht nicht zu erwar- 
ten, dass mit unterschiedlichen Methoden dasselbe gemessen werden kann (vgl. 
auch die Diskussion in Abschnitt 4). Auch Denzin selbst betont dies in neueren 
Arbeiten: 


[T]he use of multiple methods, or triangulation, reflects an attempt to secure an in- 
depth understanding of the phenomenon in question. Objective reality can never be 
captured. Triangulation is not a tool or a strategy of validation, but an alternative to 
validation [...]. The combination of multiple methods, empirical materials, perspectives 
and observers in a single study is best understood, then, as a strategy that adds rigor, 
breadth, and depth to any investigation [...]. (Denzin/Lincoln 1994: 2) 


Validierung als Zielsetzung von Triangulationsstrategien tritt somit stark in 
den Hintergrund, bleibt aber in einigen Zusammenhängen, z. B. im Rahmen 
der Messung von Interrater-Reliabilität, durchaus noch aktuell. Auch für unsere 
Fächergruppe, deren Forschungsgegenstand sich durch eine besondere Fakto- 
renkomplexion auszeichnet, scheint insbesondere der Aspekt der Erkenntniser- 
weiterung attraktiv. So zeigt Riemer (2011) am Beispiel der Fragestellung Wann 
und wie sollen in der mündlichen Sprachproduktion auftretende Grammatikfeh- 
ler im Fremdsprachenunterricht korrigiert werden?, dass zu ihrer Beantwortung 
sowohl lernersprachliche, als auch spracherwerbsbezogene, soziokulturelle und 
affektive, didaktisch-methodische sowie sprachpolitische Dimensionen in die 
Überlegungen einbezogen werden müssen, was eine triangulative Herangehens- 
weise nahezu obligatorisch erscheinen lässt. Zusammenfassend kann festgehal- 
ten werden: 
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Zwei Lesarten der Triangulationsmetapher liegen also vor: Triangulation als kumu- 
lative Validierung von Forschungsergebnissen und Triangulation als Ergänzung von 
Perspektiven, die eine umfassendere Erfassung, Beschreibung und Erklärung eines Ge- 
genstandsbereichs ermöglichen, wobei in der neueren Literatur der Aspekt der Kom- 
plementarität, das heißt der Ergänzung von Perspektiven gegenüber dem Aspekt der 
Validierung hervorgehoben wird: [...]. (Kelle/Erzberger 2004: 303-304) 


Mit den genannten Unterschieden in der Zielsetzung verbunden sind auch 
mögliche bzw. jeweils erwünschte Ergebnisse von Triangulation. Theoretisch 
möglich sind die Feststellung von Konvergenz/Kongruenz, Divergenz und 
Komplementarität in den erhobenen Daten (Kelle/Erzberger 2004: 304-307, 
Lamnek 2005: 285-289, Flick 2011b: 49). Wenn Validierung Ziel der Triangula- 
tion ist, weist Divergenz auf methodische Probleme hin, Komplementarität auf 
einen Denkfehler im Design und nur Konvergenz wäre wünschenswert. Sollen 
beispielsweise qualitative Pretests in Form von Lautdenkprotokollen prüfen, 
inwiefern Fragebogenitems tatsächlich messen, was sie messen sollen (Kelle/ 
Erzberger 2004: 305), wäre Konvergenz zwischen den Lautdenkdaten und den 
Konstruktionsintentionen des Forschers!' wünschenswert, Komplementarität 
oder gar Divergenz würden eine Überarbeitung der Items notwendig machen. 
Zu bedenken ist allerdings, dass auch Konvergenz lediglich aufgrund wahr- 
scheinlichkeitstheoretischer Überlegungen das in Forschungsergebnisse gesetzte 
Vertrauen erhöht, wobei grundsätzlich möglich bleibt, dass auch übereinstim- 
mende Befunde falsch sein können (Lamnek 2005: 285-286). 

Ist hingegen Erkenntniserweiterung Ziel der Triangulation, sind vor al- 
lem Komplementarität, aber auch Divergenz theoriebefruchtend, Konvergenz 
hingegen ist weniger interessant. So können qualitative Untersuchungen bei- 
spielsweise dabei helfen, „Lücken <variablensoziologischer> Erklärungen, bei 
denen statistische Zusammenhänge durch zusätzliche Ex-post-Annahmen 
erklärt werden, zu schließen“ (Kelle/Erzberger 2004: 306, Hervorhebung im 
Original). Vorstellbar wäre, quantitativ festgestellte Unterschiede zwischen 
L1-Gruppen (z. B. Leistungsunterschiede in einem Sprachtest) im Rahmen 
qualitativer Folgeuntersuchungen auf ihre denkbaren Ursachen (z. B. Moti- 
vationsunterschiede o. Ä.) hin zu untersuchen. Divergenzen, die nicht durch 
Methodenfehler zu erklären sind, können darüber hinaus zur Modifikation 


1 In den Beiträgen dieses Bandes werden maskuline und feminine Formen in unter- 
schiedlicher Weise verwendet. Unter der Voraussetzung, dass jeweils beide Geschlech- 
ter gemeint sind, haben die Herausgeberinnen entschieden, diese Vielfalt bestehen zu 
lassen. 
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vorhandener oder sogar zur Entwicklung ganz neuer und den Forschungsge- 
genstand adäquater abbildender Theorien führen (Kelle/Erzberger 2004: 307, 
Lamnek 2005: 287). 

Problematischer als der Umgang mit komplementären Ergebnissen gestaltet 
sich jedoch der mit divergenten (vgl. Lamnek 2005: 286-289). Da es unbefrie- 
digend erscheint, widersprüchliche Aussagen einfach gleichwertig nebeneinan- 
der stehen zu lassen, werden verschiedene Strategien des Umgangs mit solchen 
Befunden eingesetzt. So wird häufig ein Ergebnis stärker gewichtet als das an- 
dere, oder es wird versucht, Ad-hoc-Erklärungen zu generieren, die eine Brücke 
zwischen den Befunden bilden sollen, „die aber einen methodisch und theore- 
tisch anderen Charakter, nämlich beobachtungsfremden, haben als die empi- 
rischen Ergebnisse selbst. Ex-post-Erklärungen stellen [...] implizite Theorien 
dar, die in ihrem Status unsicher sind“ (Lamnek 2005: 287). Möglicherweise 
werden (insbesondere unter dem Druck von Auftragsforschung) nicht ins Bild 
passende Befunde auch schlicht unterschlagen oder geben im besten Fall Anlass 
zu Folgestudien (ebd.: 288). 


3. Formen der Triangulation nach Denzin (1970) 


Ausgehend von den beschriebenen Zielsetzungen von Triangulation lassen sich 
verschiedene Formen unterscheiden, wobei die bekannteste Klassifikation die 
nach Denzin (1970: 301-310) ist: 


e Daten-Triangulation/data triangulation (Daten, die aus verschiedenen Quel- 
len, von verschiedenen Zeitpunkten, unterschiedlichen Orten, unterschiedli- 
chen Personen stammen), 

e Forscher-Triangulation/investigator triangulation (Einsatz verschiedener 
Datenerheber, -aufbereiter, -auswerter), 

e Theorien-Triangulation/theory triangulation (Annäherung an den For- 
schungsgegenstand aus unterschiedlichen theoretischen Perspektiven), 

e Methoden-Triangulation/methodological triangulation? (within-method, z. B. 
Verwendung unterschiedlicher Subskalen in einem Fragebogen; between-/ 
across-method, Verwendung unterschiedlicher Methoden). 


Von Datentriangulation kann z. B. gesprochen werden, wenn ein Beob- 
achtungsverfahren an verschiedenen Schulen oder messwiederholend zu 


2 Während Denzin selbst von methodologischer Triangulation spricht, was eigentlich 
zutreffender, da umfassender ist, hat sich im Deutschen die Übersetzung mit Metho- 
den-Triangulation durchgesetzt. 
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mehreren, aufeinander folgenden Zeitpunkten eingesetzt wird. Forschertri- 
angulation findet statt, wenn zwei oder mehrere Forscher (z. B. im Rahmen 
einer Forschungswerkstatt) ein Interviewtranskript diskutieren oder wenn zwei 
oder mehrere Forscher Lernersprache profilanalytisch analysieren und ihre 
Ergebnisse miteinander vergleichen. Theorientriangulation meint, dass zwei 
oder mehrere ganz unterschiedliche theoretische Zugänge zu Daten gewählt 
werden. Denkbar wäre im Kontext unserer Fächergruppe beispielsweise, eine 
aufgenommene Sprachfördersituation für das Deutsche als Zweitsprache einer- 
seits konversationsanalytisch, andererseits linguistisch auf bildungssprachliche 
Merkmale und mögliche, damit verbundene Verständigungsschwierigkeiten 
hin zu untersuchen. Aguado (2014, vgl. auch Denzin selbst 1970: 303) zufolge 
kommt Theorientriangulation in der Sprachlehr- und -lernforschung jedoch 
quasi nicht vor, da sie mit einem hohen Aufwand für den einzelnen Forscher 
verbunden wäre. In interdisziplinären Forschungsverbünden wäre sie jedoch 
durchaus vorstellbar. 

Methodentriangulation schließlich ist die wohl am häufigsten vorkom- 
mende Form der Triangulation, die bereits von Denzin (1970) zentral be- 
sprochen wird und in den Sozialwissenschaften auch unter dem Begriff der 
multiplen Operationalisierung diskutiert wird (Aguado/Riemer 2001: 247). 
Zu unterscheiden sind in diesem Zusammenhang Methodentriangulation 
innerhalb einer Methode (within-method-triangulation), wenn z. B. im Rah- 
men eines Interviews Elemente des narrativen Interviews und Elemente des 
Leitfadeninterviews miteinander kombiniert werden (Flick 2004: 312-313), 
und zwischen unterschiedlichen Methoden (between-method-triangulation), 
wenn z. B. ein reaktives Verfahren wie ein narratives Interview mit einem 
non-reaktiven Verfahren wie einer Dokumentenanalyse kombiniert wird 
(Flick 2004: 313). Letztere Form tritt dabei wiederum wesentlich häufiger als 
erstere auf. 

Diese beiden Typen der Triangulation haben nicht nur klassifikatorische 
Bedeutung, sondern verweisen auch auf methodologische Differenzierungen: 
Die within-method bezieht sich im Wesentlichen auf den Kreuzvergleich der 
Techniken zum Zwecke der Feststellung der internen Konsistenz oder Reliabili- 
tät, während die between-method den Grad der externen Validität erhöhen soll 
(Lamnek 2005: 278). 

Es lassen sich also wiederum Bezüge zwischen den weiter oben erläuterten 
zwei Zielsetzungen von Triangulation herstellen. Einige Beispiele sinnvoller 
zwischenmethodischer Triangulation für unsere Fächergruppe, die hier zur 
Veranschaulichung angeführt werden sollen, geben McDonough/McDonough 
(1997: 222): 
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. Using questionnaires and selective interviewing in needs analysis. 

. Combining observation and documentary evidence in programme evaluation. 

. Using test data, experiment and self-reporting in research on reading comprehension. 

. Mixing diaries, interviews, documents, all from different sources, in case studies of 
individuals. 


A U Ne 


5. Student course evaluation by prompted focus group discussion at the end of the 
course with diaries written during the course. 


Flick (2004: 315-316) führt außerdem den Begriff der systematischen Perspekti- 
ventriangulation als weitere Triangulationsform ein, die der Theorientriangula- 
tion ähnele, sich Flick zufolge aber auf alle vier Triangulationsformen beziehen 
lasse, z. B. wenn über Methodentriangulation subjektive Sichtweisen, z. B. von 
Beratern, mit der Beschreibung alltäglicher Routinen trianguliert würden. 
Dabei gehe es immer um Ergänzung, nicht um „Aufhebung von Widersprü- 
chen‘, wobei Triangulation auch als Mittel zur Demokratisierung von Forschung 
betrachtet wird, da verschiedene Perspektiven einander gleichwertig behandelt 
werden sollen. Wenn beispielsweise Schüler ein innovatives Unterrichtsmaterial 
negativ evaluieren, dann ist das so stehenzulassen, auch wenn Eltern und Lehrer 
das Material hervorragend finden. Flick (201la: 12) verwendet Perspektivent- 
riangulation somit offenbar als eine Art Oberbegriff. Zu beachten ist, dass es 
sich bei allen beschriebenen Formen von Triangulation rein technisch betrachtet 
immer um die Triangulation von Daten bzw. Datensätzen handelt, da jede Tri- 
angulationsform die Existenz mindestens zweier Datensätze voraussetzt, welche 
zueinander in Beziehung gesetzt werden.’ Von Datentriangulation wird jedoch 
nur gesprochen, wenn zwei Datensätze verglichen werden, die mit derselben 
Methode erhoben wurden (vgl. Tab. 1). 

Auch die Einbettung einer Studie in ihren Forschungskontext im Rahmen von 
Forschungsüberblick und Diskussion könnte in einer breiteren Sicht auf erkennt- 
nistheoretischer Ebene als eine Art von Triangulation betrachtet werden, da 
Bezüge zwischen bereits vorhandenen Daten und den neu erhobenen hergestellt 
werden. Insbesondere Replikationsstudien können in diesem Zusammenhang 
sehr erhellend sein. 

Nicht um Triangulation handelt es sich hingegen, wenn im Rahmen 
derselben Studie schlicht unterschiedliche Variablen gemessen werden, 


3 Auch im Falle von Forscher-Triangulation z. B. entstehen, wenn zwei Forscher den- 
selben Datensatz analysieren, zwei Datensätze, nämlich die Analyse von Forscher A 
und die Analyse von Forscher B, welche im Anschluss miteinander verglichen respek- 
tive trianguliert werden. 
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wenn also z. B. mittels Fragebogen die Sprachlernmotivation von Unter- 
suchungsteilnehmenden und mittels Test der Sprachstand derselben Per- 
sonen ermittelt werden. Dann liegen zwar auch zwei Datensätze vor, die 
(im beschriebenen Fall z. B. in Form einer Korrelation) aufeinander bezo- 
gen werden, jedoch dienen die Messungen weder der Validierung noch der 
Erkenntniserweiterung, sondern operationalisieren zwei ganz unterschiedli- 
che Forschungsgegenstände. 


Tabelle 1: Triangulationsformen 
(D = Datensatz, F = Forscher, M = Methode, T = Theorie) 


Methoden- Methoden- 
Triangulation Triangulation 
(within-method) | (accross-method) 


Daten- Forscher- Theorien- 
Triangulation |Triangulation | Triangulation 


D1 (MI) F1 & F2 T1 & T2 D1 (M1) 
f v e N) 2 | D(M1 ® M2) 2 
D2 (M1) D D D2 (M2) 


Perspektiven-Triangulation 


4. Triangulation innerhalb des qualitativen, innerhalb 
des quantitativen und zwischen dem qualitativen 
und quantitativen Forschungsparadigma(s) 


Weiter gestaltet sich die Diskussion um Triangulation als Forschungsstrategie 
sehr unterschiedlich in Abhängigkeit davon, in welchem Forschungsparadigma 
sie angesiedelt wird. Möglich ist Triangulation innerhalb des qualitativen For- 
schungsparadigmas, Triangulation zwischen dem qualitativen und dem quan- 
titativen Forschungsparadigma und Triangulation innerhalb des quantitativen 
Forschungsparadigmas. Letzteres findet gängig statt, wenn z. B. ein Sprachstands- 
test in unterschiedlichen Bundesländern normiert wird (Datentriangulation), 
Sprachstand mit zwei oder mehreren, einander ergänzenden Messinstrumenten 
erhoben wird (Methodentriangulation) usw. Diese Vorgehensweisen sind per 
Definition als Triangulation zu bezeichnen, werden jedoch in der Regel nicht 
als solche diskutiert, sondern einfach durchgeführt. Triangulation innerhalb des 
qualitativen Paradigmas hingegen wird in jüngster Zeit stark ins Zentrum der 
forschungsmethodologischen Diskussion gestellt und als Weg zu angestrebter 
Multiperspektivität teilweise sogar zu einer Art Gütekriterium qualitativer For- 
schung erhoben. Der erkenntnistheoretische Nutzen der Triangulation ist hier 
angesichts der Subjektivität qualitativer Forschungszugänge unmittelbar ein- 
sichtig und im Kern unstrittig. 
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Kontrovers hingegen wird die Verknüpfung qualitativer und quantitati- 
ver Datensätze gesehen, die häufig unter dem Schlagwort der mixed methods’, 
manchmal auch mixed methodologies diskutiert wird und bereits als drittes for- 
schungsmethodologisches Paradigma ausgerufen wurde (Tashakkorie/Teddlie 
2003: ix-x, 2010: ix, Johnson/Onwuegbuzie 2004, Johnson et al. 2007, vgl. auch 
die umfassenden einführenden Publikationen von Plano Clark/Creswell 2008, 
Creswell 2009, Creswell/Plano Clark 2011). Kontrovers läuft die Debatte des- 
halb, weil es zwischen Vertretern des qualitativen und des quantitativen Lagers 
nach wie vor ungeklärt ist, in welchem erkenntnistheoretischen Verhältnis bei- 
de Paradigmen zueinander stehen. Während manche beide Herangehensweisen 
an empirische Forschung für gänzlich unvereinbar halten und einen „Paradig- 
menkrieg“ führen (was mittlerweile allerdings eher eine forschungshistorische 
Position darstellt), propagieren andere die Eignung der jeweiligen Paradigmen 
in Abhängigkeit von der Forschungsfrage, wieder andere ordnen entweder die 
qualitative oder die quantitative Forschung der jeweils anderen Richtung über, 
halten den sukzessiven Einsatz qualitativer und quantitativer Forschung für ziel- 
führend oder - und das ist die genuin triangulative Position - fordern die ab- 
solut gleichberechtigte Verknüpfung beider Zugänge (vgl. Mayring 2001: 7-9, 
Flick 2011b: 40-42, Gläser-Zikuda et al. 2012: 8 für einen Überblick über Kom- 
binationsmöglichkeiten qualitativer und quantitativer Ansätze auf Ebene des 
Forschungsdesigns). 

Sehr gängig vertreten wird der Standpunkt, dass qualitative und quantitati- 
ve Forschung in Abhängigkeit von der Forschungsfrage und in unterschiedli- 
chen Phasen des Erkenntnisprozesses jeweils angemessener erscheinen. Dabei 
wird auf das Phasen- oder Vorstudienmodell zurückgegriffen (Barton/Lazars- 
feld 1955, Mayring 2001: 8, Kelle/Erzberger 2004: 300-302, Lamnek 2005: 
281-282, Gläser-Zikuda et al. 2012: 8), das postuliert, dass explorative, Hypo- 
thesen generierende Vorstudien qualitativ angelegt sein sollten, Hypothesen 
testende Folgestudien hingegen quantitativ. Diese Sequenzierung wird jedoch 
von einigen Wissenschaftlern als Abwertung qualitativer Forschung (miss-) 
verstanden, da qualitative Forschung der quantitativen in diesem Fall ledig- 
lich zuarbeite.” Im Gegenzug wird von manchen qualitativen Forschern eine 


4 In der anglophonen Literatur hingegen wird Triangulation hingegen genau anders 
herum meist als eine Unterform von mixed methods betrachtet (vgl. die Diskussion 
bei Johnson et al. 2007, Bergman 2011: 272). 

5 Abgesehen davon gilt die Annahme, qualitative Forschung diene der Hypothesenge- 
nerierung, quantitative Forschung der Hypothesentestung, zwar prototypisch bzw. in 
der großen Mehrheit der Fälle, jedoch nicht ausnahmslos. So kann eine quantitative 
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erkenntnistheoretische Überordnung qualitativer Forschung über die quanti- 
tative propagiert, eine Position, die „seltener, dafür aber radikaler vertreten“ 
(Flick 2011b: 41) wird. Argumentiert wird, dass qualitative Daten aufgrund 
ihrer Komplexität für sich allein genommen interpretierbar und damit frucht- 
bar seien, quantitative Daten hingegen häufig aus sich selbst heraus nicht er- 
klärbar seien (vgl. Flick 2011b: 41-42). So könnte man z. B. quantitativ messen, 
dass eine Schulklasse höhere Leistungszuwächse zeigt als die Vergleichsklas- 
se, wüsste aber aus der reinen Messung heraus nicht, warum dies der Fall ist. 
Qualitative Unterrichtsbeobachtungen, Befragungen usw. hingegen könnten 
hier Erklärungen liefern. Das ist sicherlich zutreffend; anders herum kann 
man aber natürlich auch argumentieren, dass die Leistungsunterschiede, die 
interpretiert werden sollen, in der rein qualitativen Betrachtung beider Schul- 
klassen gar nicht sichtbar geworden wären. Beide Zugänge tragen somit nur 
gemeinsam zu einem vollständigeren Bild des Untersuchungsgegenstandes bei 
(vgl. Settinieri 2012: 250-253). 

Dies führt Flick dazu, im Rahmen triangulativer Ansätze eine echte Gleichbe- 
rechtigung beider Paradigmen zu fordern und den Begriff der Triangulation auf 
Studien zu beschränken, die diese gewährleisten: 


Es gibt nur wenige Beispiele, in denen Methoden entwickelt werden, die tatsächlich 
qualitative und quantitative Strategien in einer Methode integrieren. Viele Frage- 
bogen enthalten offene oder Freitext-Fragen, was in manchen Kontexten schon als 
qualitative Forschung verstanden wird, obwohl kaum ein methodisches Prinzip quali- 
tativer Forschung mit diesen Fragen aufgegriffen wird. Dies ist weniger eine explizite 
Kombination beider Formen der Forschung als der Versuch, einen Trend aufzugrei- 
fen. (Flick 2011b: 48) 


Tashakkori/Teddlie (2003: xi) gehen sogar so weit zu fordern, verschiedene 
Ansätze in allen Untersuchungsphasen zu berücksichtigen und eine Transfor- 
mation der Daten zwischen den Ansätzen vorzunehmen. Dieser Maximalan- 
forderung an Triangulation steht die Minimalforderung, Triangulation setze 
voraus, dass sich unterschiedliche Datensätze auf einen gemeinsamen Untersu- 
chungsgegenstand beziehen, gegenüber. Eine vermittelnde Position fordert die 
Ausschöpfung beider Zugänge in ihrer Eigengesetzlichkeit und eine Gleichge- 
wichtung insbesondere bei der Dateninterpretation. Sie integriert damit auch die 
Forderung nach der Gegenstandsangemessenheit empirischer Vorgehensweisen 


explorative Faktorenanalyse beispielsweise durchaus zur Hypothesengenerierung 
eingesetzt werden. 
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und zielt darauf, die Stärken beider Paradigmen zu nutzen. Eine Transformati- 
on zwischen beiden Paradigmen erscheint hingegen problematisch. So sollten 
beispielsweise Daten aus narrativen Interviews zusätzlich zu ihrer qualitativen 
Analyse nicht ohne Weiteres auch quantitativ ausgewertet werden, da die Daten 
nicht nach Gütestandards quantitativer Forschung erhoben wurden. Aussagen 
wie Sieben von zehn Interviewten sind der Ansicht, dass... oder gar 70% der In- 
terviewten... sind daher irreführend. Und genuin quantitative Daten, wie bei- 
spielsweise Angaben zum Umfang erhaltenen Sprachunterrichts, qualitativ zu 
analysieren, ist häufig gar nicht möglich, da den Daten dazu in der Regel die 
Tiefe fehlt. 

Anstelle dogmatischer Forderungen erscheint zusammenfassend eine stär- 
kere Berücksichtigung forschungspragmatischer Aspekte zielführender zu 
sein. Die Über- bzw. Unterordnung des einen oder des anderen Zugangs kann 
dabei manchmal durchaus gegenstandsangemessen und der Beantwortung 
der Forschungsfrage zuträglich sein (vgl. auch die Beispiele bei McDonough/ 
McDonough 1997: 223-224). Wichtig ist vielmehr, dass grundsätzlich das 
Potenzial beider Zugänge mit Blick auf den konkreten Untersuchungsgegen- 
stand erkannt und genutzt wird. 


5. Typologie des Triangulationsbegriffs 


Neben den bereits in Abschnitt 2. bis 4. erläuterten Kriterien können Triangulati- 
onsformen zusätzlich nach weiteren Aspekten klassifiziert werden. Ebenfalls sehr 
gängig ist die Differenzierung in Vorstudien-, Verallgemeinerungs-, Vertiefungs- 
und Triangulationsmodell (Mayring 2001: 7-9). Während im Rahmen des Vor- 
studienmodells eine qualitative Studie lediglich zur Hypothesengenerierung im 
Vorfeld einer quantitativen Studie dient, beschreibt das Verallgemeinerungsmo- 
dell den Fall einer für sich stehenden qualitativen Studie, deren Ergebnisse durch 
eine quantitative Folgestudie zusätzlich auf eine Population übertragen werden 
sollen. Im Vertiefungsmodell werden Ergebnisse einer vorangehenden quanti- 
tativen Studie mittels qualitativer Folgestudie interpretativ verdichtet, und im 
Triangulationsmodell schließlich werden qualitative und quantitative Methoden 
sowohl gleichzeitig als auch gleichwertig eingesetzt, um zu einem Gesamter- 
gebnis zusammengeführt zu werden. „Im ersten Fall ist der Stellenwert bzw. die 
Funktion qualitativer Methoden überwiegend vorläufig-explorativer, im zweiten 
eigenständig deskriptiver, im dritten nachträglich-profundierender und im vier- 
ten gleichzeitig-synergetischer Art [...].“ (Lamnek 2005: 281) 

Weiter kann die Verknüpfung von Daten grundsätzlich über Einzelfälle oder 
über Gesamtdatensätze erfolgen, wobei Flick (2004: 316) die Triangulation am 
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Einzelfall als die „konsequenteste Variante“ bezeichnet. Sie liegt beispielsweise 
dann vor, wenn aus 200 Probanden einer Fragebogenstudie 10 für zusätzliche 
vertiefende Interviews ausgewählt werden (vgl. Flick 2011b: 44). Ein klarer Vor- 
teil dieser Vorgehensweise liegt darin, dass sie „Vergleiche und Verbindungen 
auch auf höherer Ebene“ ermöglicht; nachteilig hingegen erscheint die ver- 
gleichsweise hohe Belastung einzelner Teilnehmer, die die Gefahr von Ausfällen 
deutlich erhöhen kann (Flick 2004: 316-317). 

Von einer Verknüpfung über Datensätze hingegen spricht man, wenn bei- 
spielsweise aus Interviewdaten eine Typologie abgeleitet wird, die mit der Ver- 
teilung korrespondierender Fragebogenantworten in Zusammenhang gebracht 
wird (Flick 2011b: 44-45). Diese Vorgehensweise ist in der Regel weniger auf- 
wändig als die Triangulation am Einzelfall, allerdings insofern problematisch, 
als dass die Samples nicht uneingeschränkt miteinander vergleichbar sind. 
Ebenfalls problematisch für die Vergleichbarkeit von Datensätzen kann in 
diesem Zusammenhang auch eine Zeitversetzung zwischen ihnen sein (Flick 
2004: 317). 

Schließlich kann man, in Abhängigkeit von der theoretischen Fundierung 
und dem Reflexionsniveau triangulativer Vorgehensweisen, explizite und 
implizite Triangulation einander gegenüberstellen. Wenn beispielsweise ver- 
schiedene Methoden, wie insbesondere in ethnografischer Forschung gän- 
gig, eher spontan in der Erhebungssituation (z. B. im Rahmen einer längeren 
teilnehmenden Beobachtung) eingesetzt werden, spricht Flick (2004: 314) 
von impliziter Triangulation. Diese grenzt sich von im Vorfeld einer Erhe- 
bung konkret geplanter expliziter Triangulation ab. Einen zusammenfassen- 
den Überblick über Triangulationsformen bietet Tab. 2 (vgl. auch Mayring 
2001, Creswell et al. 2003, Johnson/Onwuegbuzie 2004: 22, Dörnyei 2007: 
169-173). 


6. Praxisprobleme 


In der Forschungspraxis ergeben sich einige Schwierigkeiten beim Einsatz tri- 
angulativer Strategien, insbesondere im Falle der Verknüpfung quantitativer 
und qualitativer Daten. Bei einer Triangulation über den Einzelfall muss hier 
bedacht werden, dass sich Sampling-Entscheidungen sowohl an quantitati- 
ven als auch an qualitativen Standards orientieren müssen. Während für die 
quantitative Teilstudie geklärt werden muss, wie viele Untersuchungsteilneh- 
mer ausgewählt werden müssen (z. B. mittels statistischer Power-Analyse) 
und wie diese so ausgewählt werden können, dass die Stichprobe als reprä- 
sentativ für die untersuchte Population gelten kann, ist für die qualitative 
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Teilstudie (häufig auch sukzessive) zu entscheiden, welche Untersuchungs- 
teilnehmer für die jeweilige Fragestellung interessant sein könnten, weil sie 
z. B. als typisch oder als kontrastierend gelten können (vgl. zu Samplingstrate- 
gien genauer Morse/Niehaus 2009: 63-76, Teddlie/Tashakkori 2009: 168-196, 
Settinieri 2014). Die zentrale Anforderung besteht hier also wiederum darin, 
beide Paradigmen in ihrer Eigengesetzlichkeit zu achten (vgl. z. B. Steinke 
2004 zu Gütekriterien qualitativer Forschung, Bortz/Döring 2006: 194-206 
zu Gütekriterien quantitativer Forschung, Riemer/Settinieri 2010: 765-771 zu 
einer Gegenüberstellung des quantitativen und qualitativen Forschungspara- 
digmas, Mayring 2012 zu Forschungsstandards für mixed methods designs). 
Sollen beispielsweise im Rahmen eines Vertiefungsmodells nach einer quan- 
titativen Fragebogenstudie mit einer auf Grundlage der Fragebogendaten 
ausgewählten kleineren Gruppe von Befragten zusätzliche Interviews durch- 
geführt werden, um vorgefundene quantitative Befunde besser verstehen zu 
können, so muss die Auswahl dieser Personen entlang der Forschungsfrage 
nach qualitativen Kriterien erfolgen. 

Das wohl größte Problem triangulativer Studien besteht jedoch darin, an- 
gesichts in kürzester Zeit entstehender „Datenberge“ Strategien der Redukti- 
on und der strukturierten Ergebnisdarstellung zu entwickeln. Grundsätzlich 
ist dabei hilfreich, sich immer wieder auf seine genaue Forschungsfrage zu- 
rückzubesinnen, um anhand derer fokussieren und selektieren zu können. In 
der Regel werden die einzelnen Datensätze dann in der Publikation zunächst 
unabhängig voneinander ausgewertet und interpretiert, um sie in ihrem Erhe- 
bungskontext und in ihrer Gänze zu erfassen, und erst in einem zweiten Schritt 
zueinander in Beziehung gesetzt (vgl. Aguado/Riemer 2001: 253). Bei sequen- 
ziellen Designs versteht sich die getrennte Darstellung ohnehin von selbst. In 
einigen Fällen kann aber auch eine unmittelbar integrierte Auswertung sinnvoll 
sein, insbesondere bei der Triangulation über Einzelfälle (vgl. genauer Teddlie/ 
Tashakkori 2009: 249-314 zu Verfahren der Datenanalyse und -interpretation 
im Rahmen von mixed methods designs). Spätestens bei der Gesamtinterpre- 
tation der Ergebnisse einer Studie ist die integrierte Darstellung triangulativer 
Elemente allerdings unabdingbar, um überhaupt von Triangulation sprechen 
zu können. 
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7. Fazit 


Zusammenfassend ist Triangulation die Bezugnahme unterschiedlicher Daten- 
sätze auf denselben Forschungsgegenstand, wobei qualitative und quantitati- 
ve Ansätze einander ergänzende, gleichwertige Potenziale bieten und in ihrer 
Eigengesetzlichkeit geachtet werden sollten. In rein qualitativer Forschung ist 
Triangulation in den letzten Jahren ein Güteindikator geworden und auf dem 
Wege zur conditio sine qua non. Die Verknüpfung qualitativer und quantita- 
tiver Ansätze in einer Forschungsarbeit bedarf hingegen stets einer expliziten 
theoretischen Begründung und erscheint lediglich auf Ebene der Forscher- 
Triangulation in jedem Fall gewinnbringend. Denn unabhängig vom For- 
schungsparadigma stellt es immer ein Risiko dar, eine Studie zu veröffentlichen, 
ohne dass mehr als eine Person die Daten (zumindest in Ausschnitten) analy- 
siert und interpretiert hätten. 

Dreh- und Angelpunkt der Diskussion um Sinn und Unsinn von Trian- 
gulation sind die zwei bereits ausführlicher angesprochenen Aspekte der 
echten Integration der unterschiedlichen Perspektiven sowie die Forderung 
nach einer zumindest potenziell gleichberechtigten Rolle quantitativer und 
qualitativer Forschungszugänge. Dieses Prinzip der methodologischen Of- 
fenheit (Lamnek 2005: 278-279) setzt auf Seiten der Forschenden jedoch 
forschungsmethodologische Kompetenzen im Bereich beider Paradigmen 
voraus, die nicht selbstverständlich als gegeben gelten können. Forschungs- 
verbünde scheinen hier praktikabler als Einzelstudien zu sein (z.B. Johnson/ 
Onwuegbuzie 2004: 21, Dörnyei 2007: 46-47, 174-175, Bergman 2011: 274). 
Wichtig ist in diesem Zusammenhang auch, die Reflexion über das Zusam- 
menspiel triangulativer Elemente in einer Studie transparent und für andere 
Forscher nachvollziehbar zu gestalten, damit diese sich selbst ein Bild von der 
Aussagekraft der Forschungsergebnisse machen können (vgl. Aguado 2000, 
Bärenfänger/Stevener 2001). 

Eine solche Triangulation kann dann entweder der Validierung oder der 
Erkenntniserweiterung dienen, wobei insbesondere die zweite Zielsetzung für 
unsere Fächergruppe relevant ist. Mit der Multiplikation von Perspektiven und 
somit von Datensätzen geht jedoch stets auch ein Ansteigen des Zeit- und Kos- 
tenbedarfs einher (vgl. Lamnek 2005: 291, Bergman 2011: 274), der nicht zu un- 
terschätzen und in die Planung einer triangulativen Studie miteinzubeziehen ist. 
Gerade im Falle von Qualifikationsarbeiten, die von einer Person allein durchge- 
führt werden sollen, entstehen sonst leicht „Datenfriedhöfe“ (Riemer 2010: 430). 

Und schließlich kann eine „[m]ultimethodische Vorgehensweise [...] eben- 
so wie unimethodisches Vorgehen dann nutzlos werden, wenn mit ihrer Hilfe 
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die falsche Fragestellung analysiert wird“ (Lamnek 2005: 290) oder auch bereits 
wenn nicht jede einzelne Methode für sich genommen angemessen gewählt 
wird (vgl. Flick 2011b: 54). Lamnek (2005: 290-291) spricht in diesem Zusam- 
menhang von Triangulation als einer „forschungs- und finanzierungstaktischen 
Modeerscheinung ohne ernsthafte wissenschaftliche Überzeugung“ und als 
„normative[r] Leerformel“ (Lamnek 2005: 279). In diesem Sinne sollte der Titel 
des vorliegenden Beitrags vermutlich umformuliert werden in die Frage: Trian- 
gulierst Du noch, oder forschst Du schon?‘ 
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Wie kann Interkulturelle Kommunikative 
Kompetenz im Englischunterricht der 
Grundschule untersucht werden? - 
Begründung eines Forschungsdesigns 


Sonja Brunsmeier 


Kinder wachsen in einer multikulturellen und multilingualen Welt auf. Sowohl 
in ihrem Alltag als auch im Klassenzimmer treffen Grundschulkinder auf ver- 
schiedene Kulturen und Sprachen. Die Beschäftigung mit fremden Sprachen und 
Kulturen ist somit Teil der kindlichen Lebenserfahrung. Für einen kompetenten 
Umgang mit dieser Vielfalt ist Interkulturelle Kommunikative Kompetenz (IKK) 
unabdingbar. Aktuell liegen für diese spezifische Gruppe jedoch weder ein über- 
zeugendes theoretisches Konzept noch konkrete Umsetzungsideen vor. Das Ziel 
dieser Studie ist es, das Konstrukt IKK für den Englischunterricht in der Grund- 
schule zu erfassen und über die Entwicklung und Erprobung geeigneter Aufga- 
ben zu konkretisieren und empirisch zu überprüfen. Der vorliegende Beitrag 
begründet das methodische Vorgehen der Studie. 


1. Die Relevanz der Interkulturellen Kommunikativen 
Kompetenz im Englischunterricht der Grundschule 


Kinder wachsen in einer multikulturellen und multilingualen Welt auf, in der die 
englische Sprache durch ihre globale Verbreitung eine besondere Rolle spielt. So- 
wohl in ihrem Alltag als auch im Klassenzimmer treffen Grundschulkinder auf 
verschiedene Kulturen und Sprachen. Die Beschäftigung mit fremden Sprachen 
und Kulturen ist somit Teil der kindlichen Lebenserfahrung. Durch Medien und 
in der Alltagssprache treffen Kinder verstärkt auf Anglizismen, welche die Rolle 
der englischen Sprache als Lingua Franca unterstreichen. Vor diesem Hintergrund 
kommt dem Englischunterricht in der Primarstufe bei der Vermittlung von Inter- 
kultureller Kommunikativer Kompetenz (IKK) eine besondere Bedeutung zu. 


Eine frühzeitige Entwicklung der fremdsprachlichen Kompetenzen wird als Vorberei- 
tung auf das Leben in einer durch sprachliche und kulturelle Vielfalt geprägten Umwelt 
als wichtig erachtet. Aus diesem Grund sollen alle Kinder Fremdsprachen über einen 
längeren Zeitraum hinweg und in größerer Vielfalt lernen. Zugleich sollen sie durch die 
Erfahrung und das Verstehen von Fremdem eine erweiterte Perspektive auf ihre Umwelt 
und die eigene Identität gewinnen. In dem kontinuierlichen Ausbau und Zusammenwir- 
ken dieser beiden Dimensionen wird insbesondere eine Voraussetzung für die erfolgreiche 
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Kommunikation und Vermittlung in interkulturellen Kontexten gesehen. Dem fremd- 
sprachlichen Lernen in der Grundschule kommt damit die Aufgabe zu, den Grundstein 
für diese interkulturelle kommunikative Kompetenz zu legen (Marschollek 2011: 455). 


Die Beherrschung der englischen Sprache wird auch als vierte Kulturtechnik (vgl. 
Brusch 2000: 34, Pfitzer 2006: 33) bezeichnet, da sie Kinder zu „[k]ulturelle[r] 
Teilhabe“ (Pfitzer 2006: 27) befähigt. Durch das Erlernen der Lingua Franca 
werden Kinder bereits im Grundschulalter auf gesellschaftliche Partizipation 
und den Dialog zwischen verschiedenen Kulturen vorbereitet. Durch die Aus- 
einandersetzung mit der englischen Sprache erfahren die Grundschüler/innen 
gleichzeitig auch, dass Sprache „Träger kultureller Inhalte“ (Schocker-von Dit- 
furth 2004: 217) ist und es ihnen ermöglicht, mit anderen Kulturen in Kontakt 
zu treten und sich diese zu erschließen bzw. Gemeinsamkeiten und Unterschie- 
de zwischen der eigenen und den anderen Kulturen zu entdecken (vgl. Legutke 
et al. 2009: 15). „[D]as Lernen von Sprachen [ist] ein durch nichts anderes zu 
ersetzender Anlass zum interkulturellen Lernen und zu einer seiner Grundla- 
gen, dem Fremdverstehen“ (Christ 2007: 52). Der Englischunterricht möchte die 
kindliche Neugierde für das Fremde wecken. Im „geschützten Raum“ (ebd.: 52) 
des Klassenzimmers können andere Kulturen entdeckt und erkundet werden. 
Gleichzeitig wird so die Basis für eine grundlegende Offenheit gegenüber Spra- 
chen und Kulturen geschaffen (vgl. Marschollek 2002: 119ff.). Dabei versteht 
sich das heutige Klassenzimmer als ein offener und gelegentlich virtueller Raum, 
in den viel ‚Welt‘ und ‚Erfahrung‘ eindringen (vgl. Christ 2007: 55). 

Auch bildungspolitische Papiere betonen die Notwendigkeit, Lerner auf unsere 
multikulturelle und mehrsprachige Welt vorzubereiten. Der Gemeinsame Euro- 
päische Referenzrahmen nennt Interkulturelle Kommunikative Kompetenz (IKK) 
als die zentrale Kompetenz des Fremdsprachenunterrichts (vgl. Council of Europe 
2001: 103ff.). Die bundeslandspezifischen Bildungspläne äußern sich entsprechend. 
Beispielsweise nennt der baden-württembergische Bildungsplan (vgl. Ministerium 
für Kultus, Jugend und Sport Baden-Württemberg 2004: 74ff.) IKK explizit als Ziel- 
vorgabe für den Englischunterricht. Gleiches gilt auch für die hessischen Bildungs- 
standards und Inhaltsfelder für Moderne Fremdsprachen für die Grundschule (vgl. 
Hessisches Kulturministerium 2010) und den hessischen Leitfaden für Moderne 
Fremdsprachen in der Grundschule (vgl. Institut für Qualitätsentwicklung 2011). 
Daraus folgt, dass die Anbahnung von IKK im Englischunterricht als gleichwer- 
tiges Ziel neben die sprachlichen Kompetenzen tritt. Die Zielformulierungen der 
Lehrpläne schließen den Primarbereich mit ein. Mit Beginn des Schuleintritts muss 
die Vermittlung von IKK fester Bestandteil der Unterrichtskultur sein. „If it is the 
purpose of all education to help the individual to function well in his or her society 
and if this society is multicultural already, then such help cannot be postponed to 


Interkulturelle Kommunikative Kompetenz im Englischunterricht 39 


the secondary level of education but must be given from the earliest stage of formal 
education, i.e. from the primary school onwards“ (Doye 1999: 25). 

Wenngleich Einigkeit hinsichtlich der grundlegenden Zielvorstellungen des 
Englischunterrichts in der Primarstufe besteht, und IKK als didaktischer Schlüs- 
selbegriff gelten kann, findet sich keine allgemein geteilte Definition des Begriffs: 
„the concept remains as fuzzy as ever“ (Hu/Byram 2009: XI) und „the term has 
[not] been stable and each of the two terms in the phrase ‚intercultural com- 
petence‘ is likewise much debated“ (Guilherme 2013: 346). So gibt es bis heute 
verschiedene Vorstellungen, welche Dimensionen IKK beinhaltet. Beispielhaft 
seien hier Byrams Kompetenzmodell (Byram 1997) und Bennetts Stufenmodell 
(Bennett 1986) genannt. Beide Konzeptionen haben die fremdsprachendidakti- 
sche Diskussion der letzten Jahre maßgeblich geprägt, zeigen exemplarisch aber 
eben auch auf, wie unterschiedlich die Vorstellungen in Bezug auf IKK sind. By- 
rams (1997: 31) model for intercultural communicative competence bezieht sich 
explizit auf Bildungskontexte und Bildungsziele (vgl. ebd.: 70). Er benennt fünf 
gleichwertige Dimensionen (attitudes, knowledge, skills of interpreting and rela- 
ting, skills of discovery and interaction und critical cultural awareness), die zentral 
für eine erfolgreiche interkulturelle Kommunikation sind und sich wechselsei- 
tig beeinflussen. Im Verlauf des Lernprozesses sollen die Lerner zu intercultural 
speakers (ebd.: 71) ausgebildet werden, die in der Lage sind 


to interact with people from another country and culture in a foreign language. They 
are able to negotiate a mode of communication and interaction which is satisfactory 
to themselves and the other and they are able to act as a mediator between people of 
different cultural origins. Their knowledge of another culture is linked to their language 
competence through their ability to use language appropriately - sociolinguistic and 
discourse competence - and their awareness of the specific meanings, values and con- 
notations of the language. They also have a basis for acquiring new languages and cultu- 
ral understandings as a consequence of the skills they have acquired in the first (ebd.). 


Bennetts Developmental Model of Intercultural Sensitivity (1986) geht davon aus, 
„that as one’s experience of cultural difference becomes more complex und so- 
phisticated, ones competence in intercultural relations increases“ (Hammer/ 
Bennett 2001: 12). In seinem sechsstufigen Modell spiegelt jede Stufe ein bestimm- 
tes kognitives Niveau wider, welches sich in der Entwicklung bestimmter Haltun- 
gen, Einstellungen und Verhaltensweisen bezogen auf kulturelle Aspekte zeigt. 
Beide Modellierungen fokussieren den Sekundarbereich und die Erwachse- 
nenbildung. Da sich Kinder im Grundschulalter „hinsichtlich ihrer sprachlichen, 
intellektuellen, sozialen und psychischen Entwicklung sehr“ (Christ 2003: 449) 
von älteren Lernern unterscheiden, muss dem Kontext eine besondere Beachtung 
geschenkt werden und bestehende Modelle auf deren Übertragbarkeit überprüft 
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werden. Die Forschung bezieht sich „aktuell konsequenterweise vor allem auf die 
Frage, wie interkulturelle Lernprozesse im Kontext von Fremdsprachenunterricht 
empirisch rekonstruierbar, wie Entwicklungsverläufe in diesem Kontext abbildbar 
und mit welchen Instrumenten interkulturelle Kompetenzen messbar bzw. evalu- 
ierbar sind. [...] Gleichzeitig ist es wichtig, für die Unterrichtspraxis Aufgaben zu 
entwickeln, die Interkulturelle Kommunikative Kompetenzen systematisch ent- 
wickeln und beschreibbar machen“ (Hu 2010: 77f.). Lehrkräfte fragen sich: „How 
do I teach the intercultural dimension [...]?“ (Byram etal. 2002: 10). Da Aufgaben 
als „environment or ‘ecosystem’“ (Cameron 2001: 21) gesehen werden, „in which 
the growth of skills in the foreign language takes place“ (ebd.), ist es von zentraler 
Wichtigkeit, Aufgabenformate für die Anbahnung von IKK in der Grundschule 
zu entwickeln, die es Lehrkräften ermöglichen, die ermittelten Dimensionen von 
IKK auf Klassenzimmerebene zu vermitteln. Freitag-Hild (2010) legt eine Auf- 
gabentypologie für den Sekundarbereich vor und Müller-Hartmann et al. (2013: 
115ff.) präsentieren Aufgabenkriterien, die geeignet sind, IKK ebenfalls für den 
Sekundarbereich zu vermitteln. Für den Primarbereich stehen eine Entwicklung 
von Aufgabenformaten und deren empirische Überprüfung noch aus. 

Aus den bisherigen Überlegungen ergibt sich folgende Problemstellung, wel- 
che die Grundlage für die Studie bildet: IKK ist als ein Ziel im Fremdsprachen- 
frühbeginn ausgeschrieben. Durch die enge Verbindung von Sprache und Kultur 
wird der Englischunterricht als geeigneter Ort gesehen, um den Grundstein für 
diese Kompetenz bei den jungen Lernern zu legen. Jedoch ist weder die Ter- 
minologie IKK für diesen Kontext eindeutig definiert, noch stehen umfassende 
konkrete Umsetzungsideen (Aufgaben) für die Unterrichtspraxis im Englisch- 
unterricht der Grundschule bereit. 


2. Ziel der Arbeit 


Zunächst steht die Klärung der Terminologie von IKK für den Englischunter- 
richt der Grundschule im Vordergrund. Um die Terminologie für den spezifi- 
schen Kontext Grundschule klären zu können, werden bestehende Definitionen 
und Modelle auch auf die Rahmenbedingungen, unter denen frühes Fremdspra- 
chenlernen stattfindet, bezogen. Weiterhin werden vorhandene Erkenntnisse 
der Lern- und Entwicklungspsychologie im Kindesalter beachtet, da diese bei 
der Anbahnung von IKK eine wichtige Rolle spielen. So kann ermittelt werden, 
welche Zielvorstellungen angemessen für das Grundschulalter sind. 

Basierend auf den gewonnenen Erkenntnissen soll in einem nächsten Schritt 
geklärt werden, wie Lernaufgaben beschaffen sein müssen, damit sie IKK bei 
jungen Lernern anbahnen. Dabei müssen Sprachstand, Sprachentwicklung und 
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Motivationslage der Kinder (vgl. Legutke et al. 2010: 292) berücksichtigt werden. 
Theoriegeleitet werden Aufgabendeskriptoren für diese spezifische Altersgrup- 
pe formuliert. Diese sind die Grundlage für die modellhafte Entwicklung von 
Aufgaben und Materialien. Ziel ist es also, altersgerechte Aufgaben und Mate- 
rialien zu entwickeln, die die Anbahnung von IKK im Primarbereich ermögli- 
chen. Abschließend werden die Aufgaben in vier Grundschulklassen empirisch 
erprobt und ihr Potenzial anhand der Aufgabendeskriptoren bewertet. 

Aus den empirisch erprobten Aufgabenformaten können dann Rückschlüsse 
auf die Dimensionen, die IKK anbahnen, gezogen werden. Möglichkeiten und 
Grenzen der Entwicklung von IKK im Englischunterricht der Primarstufe kön- 
nen so dargestellt und diskutiert werden. 


Abb. 1: Überblick über den Ablauf der Untersuchung 
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3. Methodisches Vorgehen 


Die einführenden Absätze haben deutlich gemacht, dass es zu IKK kaum prakti- 
sche Umsetzungen (z.B. Aufgaben) im Englischunterricht der Grundschule gibt. 
Es liegen keine empirisch überprüften Erkenntnisse über Möglichkeiten und 
Grenzen der Implementation vor. Ein quantitatives Vorgehen, welches hypothe- 
senüberprüfend und erklärend vorgeht (vgl. Lamnek 2005: 243), ist deshalb als 
forschungsmethodischer Ansatz ungeeignet. Nur ein qualitatives Design ermög- 
licht es, sich der Thematik induktiv-verstehend zu nähern, das Feld explorativ- 
interpretativ zu erforschen (vgl. Caspari et al. 2003: 499ff.) und neue Theorien 
zu generieren (vgl. Croker 2009: 9). Abbildung 1 visualisiert das methodische 
Vorgehen der Forschungsarbeit. 


3.1 Die Vorstudie 


Literaturrecherche und Dokumentenanalyse 

Grundlage der Studie ist zunächst eine Literaturrecherche, um bestehende De- 
finitionen, Modelle und Studien zu IKK national und international zu erfassen 
und auf ihre Angemessenheit für den Grundschulkontext hin zu diskutieren. 
Diese werden im Rahmen einer Dokumentenanalyse bildungspolitischen For- 
derungen auf nationaler Ebene gegenübergestellt. Die einleitende Klärung des 
Konstrukts IKK für den Englischunterricht im Primarbereich ist die Grundlage 
für die Entwicklung der Aufgaben. 


Lehrwerksanalyse 

Das Lehrwerk spielt im Englischunterricht eine zentrale Rolle, da sich viele Leh- 
rer/innen bei der Planung, Strukturierung und Durchführung an den Angebo- 
ten des Kursmaterials orientieren. Der Stellenwert, den IKK in den Units der 
Lehrwerke einnimmt, wird sich somit auch implizit im Unterricht einer Lehr- 
person widerspiegeln. Exemplarisch wurden sechs Units aus drei Lehrwerken 
analysiert, um zu ermitteln, ob und wenn ja, wie die Lehrwerke IKK aufbereiten 
und über Themen und Aufgaben umsetzen. 


Problemzentrierte Leitfadeninterviews 

Grundlage der Interviews war ein speziell für diese Befragung konzipierter In- 
terviewleitfaden, der zuvor in einer Pilotphase erprobt wurde. Jedes Interview 
wurde mit dem Einverständnis der Befragten aufgezeichnet. „Dies ermöglicht 
zum einen dem Interviewer, sich ganz auf das Gespräch einzulassen, ohne stän- 
dig Notizen machen zu müssen, und zum anderen wird im Nachhinein für eine 
unverfälschte Wiedergabe der gesprochenen Interviews gesorgt“ (Kuckartz et al. 
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2008: 26). Die transkribierten Interviews wurden inhaltsanalytisch ausgewertet. 
Die Qualitative Inhaltsanalyse (vgl. Mayring 2008) ermöglichte es, die subjekti- 
ven Perspektiven und Erfahrungen der Lehrpersonen zu rekonstruieren, da die 
Qualitative Inhaltsanalyse nicht nur eine bloße Technik, sondern immer an den 
Gegenstand und das Material der Analyse angebunden ist (vgl. ebd.: 44). Das 
regelgeleitete und systematische Vorgehen der Inhaltsanalyse, welches die Ver- 
wendung eines Kategoriensystems einschließt (vgl. ebd.: 42ff.), erlaubte es, die 
Vorstellungen der Lehrer/innen in Bezug auf IKK und deren Umsetzungen im 
Englischunterricht herauszuarbeiten. 


3.2 Die Hauptstudie 


Multiple Fallstudien 

Ursprünglich sollten aus der Lehrerbefragung (Vorstudie) unterschiedliche 
Lehrertypen generiert werden, um daraus geeignete Lehrer/innen für die empi- 
rische Hauptstudie gewinnen zu können. Zum einen hat sich jedoch das erho- 
bene Datenmaterial für eine Klassifizierung von Lehrertypen als nicht geeignet 
erwiesen. Zum anderen erklärten sich nur sehr wenige Lehrer/innen bereit, an 
der empirischen Hauptstudie teilzunehmen. Allerdings zeigte besonders eine 
Lehrperson ein starkes Interesse an der Teilnahme an der empirischen Haupt- 
studie. Es gelang ihr, noch weitere Lehrer/innen an der eigenen Grundschule 
für die Hauptstudie zu gewinnen. Insgesamt konnten drei Lehrer/innen für 
die empirische Studie an der Schule gewonnen werden. Eine/r der drei Lehrer/ 
innen bot zusätzlich an, die empirische Studie in zwei von ihren Englischklas- 
sen durchführen zu können. So standen insgesamt vier Englischklassen für die 
Hauptstudie zur Verfügung. „Es wird immer wieder unterstrichen, dass der 
Begriff ‚Fall‘ nicht ausschließlich auf individuelle Personen und ihre Lebens-, 
Erziehungs- oder Bildungsgeschichte - bzw. ihre Problem- oder Krankenge- 
schichte - beschränkt werden dürfe, sondern auch auf Gruppen (z.B. eine Fami- 
lie, eine Schulklasse, eine Jugendclique) (...) angewendet werden könne“ (Fatke 
2010: 164f.). Da es sich um vier Schulklassen, also vier ‚Fälle‘ handelt, können 
diese nach Drese (2007: 193) als „multiple Fallstudien“ definiert werden. Die 
Begleitung der vier Schulklassen an einer Grundschule erleichtert nicht nur die 
Durchführbarkeit der Studie. Von Vorteil ist auch, dass die Rahmenbedingung 
‚gesamter Schulkontext‘ eine Konstante ist und so ein besonderer Fokus auf die 
vier individuellen Klassen und die Begleitung der drei unterschiedlichen Lehrer/ 
innen gelegt werden konnte. Ziel dieses Vorgehens ist es, anhand von vier kon- 
kreten Fällen zu verstehen, welche Aspekte der Aufgaben Lehrer/innen bei der 
Planung eines interkulturellen kommunikativen Englischunterrichts diskutieren 
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und wie die Lehrer/innen das Potenzial der neu entwickelten Aufgaben nach der 
Durchführung im Unterricht im Hinblick auf IKK beurteilen. 


Participatory Action Research 

Participatory Action Research (PAR) lässt sich der Handlungsforschung zuord- 
nen, welche in Publikationen und Studien neueren Datums verstärkt Beach- 
tung gefunden hat (Allwright/Hanks 2009, Heigham/Croker 2009, Yoshida et 
al. 2009, Burns 2010, Friebertshäuser et al. 2010). PAR ist eine Methode, die 
nicht ‚über‘ Lehrer/innen aus einer distanzierten Perspektive forscht, sondern 
vielmehr kooperativ mit ihnen neues Wissen generieren möchte (vgl. McIntyre 
2008: xii). So kann die Perspektive der Lehrer/innen verstanden und Implikati- 
onen für die Gestaltung zukünftiger Unterrichtsprozesse abgeleitet werden. Im 
Zentrum steht das gemeinsame Interesse von Teilnehmer/innen und Forscher/ 
in, die Forschungsfrage unter den gegebenen Rahmenbedingungen eines spe- 
zifischen Feldes gemeinsam zu beantworten. Das Bündnis zwischen Lehrer/ 
innen und Forscher/in bildet bei PAR die Grundlage für einen gelingenden 
Forschungsprozess (vgl. ebd.: 1). Dabei werden „Forschung und Entwicklung 
[...] nicht methodologisch voneinander getrennt, sondern als aufeinander zu 
beziehende Teile ein und desselben Vorhabens verstanden“ (Altrichter et al. 
2010: 803). Den Forschungsprozess charakterisiert ein zyklisches Vorgehen. Die 
Phasen Planning, Action, Observation und Reflection können zyklisch und/oder 
iterativ verlaufen, bis ein zufriedenstellendes Ergebnis erreicht ist.(vgl. Burns 
2010: 7). Dieses Vorgehen erlaubt es, die entwickelten Aufgaben gemeinsam mit 
den Lehrer/innen auf den jeweiligen Kontext anzupassen, den aus den Aufga- 
ben resultierenden Prozess effektiv zu begleiten und abschließend auszuwerten. 
Durch eine Perspektiventriangulation können zudem Verzerrungen durch die 
Person des Forschers/der Forscherin aufgedeckt bzw. minimiert werden (vgl. 
Flick 2011: 14). 


Die Datenerhebung 

Die empirische Hauptstudie bedient sich unterschiedlicher Erhebungsmethoden. 
Dieses Vorgehen wird als Methodentriangulation (between-method) (vgl. Flick 
2011: 15f.) bezeichnet. Die Kombination verschiedener Methoden stellt „weniger 
ein Instrument der Überprüfung empirischer Ergebnisse als einen Weg zu er- 
weiterten Erkenntnismöglichkeiten [dar]“ (ebd.: 9). Dabei ist zu beachten, „dass 
jede Methode ihren Gegenstand konstituiert (...) [und somit] unterschiedliche 
Konstruktionen eines Phänomens [zeigt]“ (ebd.: 25). Der Vorteil einer Kombi- 
nation von Methoden ist also der zusätzliche Erkenntnisgewinn im Hinblick 
auf den Untersuchungsgegenstand. Das gleiche Ziel verfolgt die Triangulation 
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von Perspektiven (vgl. ebd.: 20ff.). In dieser Studie werden die Annahmen, Per- 
spektiven und Wahrnehmungen der Lehrer/innen und Schüler/innen eingeholt 
und mit denen der Forscher/in trianguliert. So können emische Sichtwei- 
sen (Innenperspektive der Forschungspartner (Lehrer/innen und Schüler/ 
innen) mit der etischen Perspektive (Außenperspektive der Forscher/in) abge- 
glichen werden (vgl. Drese 2007: 192). 

Im Folgenden werden die unterschiedlichen Erhebungsmethoden und Per- 
spektiven vorgestellt, ihre unterschiedlichen Erkenntnisinteressen herausge- 
arbeitet und aufgezeigt, wie durch ihre Kombination ein Erkenntniszugewinn 
möglich ist. 


Die Unterrichtsdokumentation: Videografie 

Bei der Durchführung der Aufgaben wurden alle Unterrichtsstunden mit 
dem Einverständnis der Beteiligten videografiert. Die Unterrichtsmitschnitte 
dürfen jedoch nur in anonymisierter Textform veröffentlicht werden. Mithil- 
fe dieses Vorgehens konnte die Komplexität des Unterrichtsgeschehens (z.B. 
Interaktionen, Entscheidungen der Lehrer/innen, non-verbales Verhalten, 
Reaktionen und Bearbeitungsprozesse der Schüler/innen u.v.m.) festgehal- 
ten werden. „Ihr [der Videografie] wissenschaftlicher und forschungsme- 
thodischer Mehrwert liegt auch in der relativ theorieunabhängigen und 
komplexitätserhaltenden Dokumentation, der theoretisch unbegrenzt häufi- 
gen Reproduzierbarkeit zu Analysezwecken“ (Schramm/Aguado 2010: 186). 
Um das komplexe Geschehen im Klassenzimmer möglichst differenziert er- 
fassen zu können, wurde der Empfehlung von Walsh (2011: 68) gefolgt, zwei 
Kameras einzusetzen. Auch wenn die Filmaufnahmen eine sehr alltagsnahe 
Erhebungssituation darstellen, so sind die Kameras doch ein Fremdkörper 
im Klassenzimmer, der die Faszination vieler Kinder auf sich zieht. Um diese 
Reaktivität zu reduzieren, lernten die Kinder zu Beginn der Aufnahmen die 
Kameras in einer Probestunde kennen, d.h. jede/r Schüler/in durfte sich die 
Kameras genau betrachten, Fragen stellen und durch das Objektiv schauen. 
Das Vertrautmachen mit der Technik führte dazu, dass die Mehrheit der Kin- 
der das Interesse an den Kameras verlor. 

Die Videoaufnahmen des Unterrichts wurden durch Transkription in Texte 
(vgl. Flick 2010: 314) umgewandelt und bildeten so die Grundlage für weitere 
Analysen. Hier wurde ein Nachteil der Methode deutlich. Dadurch, dass viele 
Schüler/innen gleichzeitig in den Gruppenarbeitsphasen mit ihren Mitschüler/ 
innen sprachen, konnten diese individuellen Unterhaltungen nicht von den 
Kameras erfasst werden und hinterher somit auch nicht verschriftlicht werden. 
Gleiches gilt für Unterrichtssituationen, in denen mehrere Schüler/innen sich 
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zeitgleich äußerten oder es laute Nebengeräusche im Klassenzimmer gab. Da die- 
ser Umstand bereits während der Videoaufnahmen auffiel, wurden die Kinder 
in der nächsten geplanten Gruppenarbeit mit jeweils einem Audiogerät versorgt. 
In der Unterrichtsstunde selber zeigte sich dann jedoch, dass zum einen das 
Verteilen der Geräte den Unterricht unterbrach und zum anderen die Schüler/ 
innen durch die Geräte sehr abgelenkt waren. So wurde auf den zusätzlichen 
Einsatz der Audiogeräte verzichtet und dieser Nachteil der Videoaufnahmen in 
Kauf genommen. Die Videoaufnahmen an sich müssen jedoch bereits als Inter- 
pretation verstanden werden, da sie nur einen selektiven Ausschnitt der Wirk- 
lichkeit aufzeichnen. 


Teilnehmende Beobachtung 

In Ergänzung zu den Videoaufnahmen nahm der/die Forscher/in an jeder 
Unterrichtsstunde teil. Im Sinne der offenen Beobachtung (vgl. Lamnek 2005: 
560f.) wurde den Lehrer/innen und Schüler/innen die Rolle des Forschers/der 
Forscherin dargelegt. Genau wie die Videografie erlaubt die teilnehmende Be- 
obachtung das Verhalten der Teilnehmer/innen aus einer Außenperspektive zu 
beobachten (vgl. Cowie 2009: 166). Allerdings steht der Beobachter bei der teil- 
nehmenden Beobachtung „nicht passiv-registrierend außerhalb seines Gegen- 
standsbereiches, sondern nimmt selbst teil an der sozialen Situation, in der der 
Gegenstand eingebettet ist. (...) [E]r sammelt Daten, während er an deren natür- 
lichen Lebenssituation partizipiert“ (Mayring 2002: 80). Obwohl so die gesamte 
Komplexität der Unterrichtsprozesse in ihrem natürlichen Umfeld beobachtet 
werden konnte, entsteht bei jeder Beobachtung das Phänomen des observer's 
paradox (Nunan 2013: 595). Dieses besagt, dass ein Paradoxon entsteht, wenn 
man beobachten möchte, wie sich Menschen ohne systematische Beobachtung 
in ihrer natürlichen Umgebung verhalten, diese dafür aber systematisch beob- 
achten muss (vgl. ebd.). Jede/r teilnehmende beobachtende Forscher/in muss 
sich dessen bewusst sein. 

Während der Unterrichtsstunden wurden Aspekte notiert, die dem/der For- 
scher/in aus seiner/ihrer Außenperspektive relevant erschienen und mit den 
Lehrer/innen besprochen werden sollten. In Ergänzung zu dieser unstruk- 
turierten Beobachtung (vgl. Lamnek 2005: 559f.) erlaubten die vorab entwi- 
ckelten Aufgabendeskriptoren die Beobachtungen zu systematisieren und 
strukturieren. Dadurch, dass der/die Forscher/in durch die teilnehmende Be- 
obachtung ein Teil der Unterrichtssituation geworden ist, entsteht somit au- 
tomatisch eine Reaktivität mit dem Feld. In der qualitativen Forschung ist es 
absolut notwendig, dass der/die Forscher/in seine/ihre Rolle reflektiert (vgl. 
Bortz/Döring 2006: 339). 
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Sowohl die Videoaufnahmen als auch die Unterrichtsbeobachtungen bil- 
den das Unterrichtsgeschehen von außen ab (Außenperspektive). Will man 
jedoch verstehen, welche Bedeutungen die Teilnehmenden mit ihren Hand- 
lungen verbinden, bedarf es auch der Erforschung, wie Lehrer/innen und 
Schüler/innen den Unterricht wahrnehmen (Innenperspektive). Deshalb 
wurden lehrer- und schülerbezogene Datensätze in Form von Beobachtungs- 
bögen, Interviews, Fragebögen und Unterrichtserzeugnissen mit in die Stu- 
die einbezogen. 


Lehrerbezogene Datensätze 

Den Lehrer/innen kommt in dieser Studie eine besondere Rolle zu. Sie sind 
Partner/innen im Forschungsprozess (PAR) und unterstützen diesen mit 
ihrer kontextspezifischen Expertise sowie ihrem Erfahrungswissen bezogen 
auf ihren Englischunterricht und ihre Schüler/innen. Das Wissen über ihren 
Kontext brachten die Lehrer/innen in verschiedenen Gesprächen mit ein und 
hielten ihre Eindrücke des Unterrichtsgeschehens in Beobachtungsbögen 
fest. 


Vorbesprechung 1 mit den Lehrer/innen (Gruppengespräch) 

Das erste Gespräch fand in Form eines gemeinsamen Gruppentreffens an der 
Schule der Lehrer/innen statt. Zunächst wurden die Lehrer/innen in das For- 
schungsvorhaben eingeführt und das Ziel der Studie erläutert. „[P]ractitioners 
of PAR have an obligation at the beginning of a PAR project to let their desires 
be known to research participants about how they, as researchers, intend to ana- 
lyze and disseminate research data“ (McIntyre 2008: 54). Weiterhin wurden die 
Rollen im Forschungsprozess geklärt. Der/Die Forscher/in plante und begleitete 
die empirische Studie. Dazu zählten auch die theoretisch fundierte Planung des 
Unterrichts und die Entwicklung der Materialien. Die Lehrer/innen hatten die 
Aufgabe die Unterrichtsplanungen und Materialien vorher immer auf ihre Klas- 
se und die Machbarkeit zu prüfen. Diesbezüglich sollten sie dem/der Forscher/ 
in Rückmeldung geben, damit die Planungen und Materialien bei Bedarf über- 
arbeitet werden konnten. Der Unterricht an sich wurde von den Lehrer/innen 
durchgeführt. Der/Die jeweilige Lehrer/in blieb somit die gewohnte Bezugsper- 
son für die Schüler/innen. 


Vorbesprechung 2 mit den Lehrer/innen (Einzelgespräch) 

Ziel der Einzelgespräche war es, individuell mit jedem/r Lehrer/in die Ent- 
würfe der Unterrichtsplanungen und Materialien in Bezug auf die jeweilige 
Klasse abzustimmen. Insgesamt wurden die Planungen sehr offen und positiv 
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aufgenommen und es mussten nur kleinere Überarbeitungen (wie z.B. Begrü- 
ßungsformen, Rituale) vorgenommen werden. 


Gespräche und Absprachen im Erhebungszeitraum 

Immer am Ende einer Unterrichtswoche erhielten die Lehrer/innen die bei- 
den Verlaufspläne mit allen Materialien für die darauffolgende Woche. So hat- 
ten die Lehrer/innen stets genug Zeit, sich auf die neue Woche vorzubereiten, 
Unklarheiten mit dem/der Forscher/in abzusprechen und die ausgearbeiteten 
Unterrichtsideen in Bezug auf Machbarkeit und Relevanz für ihren Kontext zu 
überprüfen. 


Nachbesprechung mit den Lehrer/innen 

Nach Abschluss der Unterrichtseinheit in jeder Klasse wurde mit jedem/r Leh- 
rer/in ein umfassendes, retrospektives Einzelgespräch (ca. 60 Minuten) geführt, 
welches mit einem Audiogerät aufgezeichnet wurde. Grundlage der Interviews 
war ein Interviewleitfaden. Die Fragen waren so formuliert, dass sie die Lehrer/ 
innen zum Erzählen anregten, denn es war von Interesse, zu erfahren, wie die 
Lehrer/innen die Unterrichtseinheit wahrgenommen hatten und wie sie aus ih- 
rer Sicht das Potenzial der Aufgaben und Materialien im Hinblick auf die Ent- 
wicklung von IKK bewerten. 


Beobachtungsbögen 

Das Abschlussgespräch bezog sich auf die Reflexion der gesamten Unterrichts- 
einheit. Im Rahmen dieser Interviews wäre es aber nicht zielführend gewesen, 
alle Unterrichtsstunden einzeln im Hinblick auf das Potenzial der Aufgaben zu 
besprechen. Dies wäre zum einen zu umfangreich geworden und zum anderen 
wären bis zum Ende der Einheit manche Erinnerungen eingetrübt oder durch 
andere Ereignisse überlagert worden. Um aber eine Rückmeldung zu den Aufga- 
ben in jeder einzelnen Englischstunde zu erhalten, sind Beobachtungsbögen ein 
geeignetes Instrument, da sie eine „systematische Beobachtung“ (Hochstetter 
2011: 39) des Unterrichtsgeschehens erlauben. 

Die Erstellung der verwendeten Beobachtungsbögen für die empirische Stu- 
die unterlag einem Entwicklungsprozess. Bei dem ersten Treffen mit den Leh- 
rer/innen (Gruppengespräch) wurde die Bereitschaft der Lehrer/innen erfragt, 
einen Beobachtungsbogen (Umfang zwischen 1 und 4 Seiten) nach jeder Stun- 
de auszufüllen, da dieses mit einem zusätzlichen Zeitaufwand für die Lehrer/ 
innen verbunden war. Alle zeigten sich jedoch einverstanden und offen, denn 
über das konkrete Schülerverhalten (task-in-process) konnte geschlussfolgert 
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werden, ob die Aufgabenkriterien das Potenzial hatten, IKK anzubahnen. 
Dennoch sind „für die interkulturelle Kompetenz gewünschte Haltungen und 
Einstellungen zur Zielsprache, zur Kultur in einem Zielsprachenland oder all- 
gemein zu Fremden besser über Befragungen, Diskussionen oder andere Me- 
thoden zu ermitteln als ausschließlich über Beobachtungen“ (ebd.: 42f.). Aus 
diesem Grund sind die Beobachtungsbögen nur eine Methode, um Einblicke 
in das Unterrichtsgeschehen zu erhalten. Die Stärke dieses Instruments liegt in 
der systematischen und somit eher objektiven Beurteilung des Unterrichts und 
ist zum anderen ein Format, mit dem die Lehrer/innen (z.B. aus Lehrwerken) 
vertraut sind. 

Zusätzlich zu den Lehrer/innen trug auch der/die Forscher/in, zeitnah nach 
jeder Englischstunde, ihre Beobachtungen in den klassenspezifischen Beobach- 
tungsbogen ein. So konnten zwei Perspektiven auf dasselbe Geschehen gegen- 
übergestellt werden. Gleiche Beobachtungen verstärkten die Annahme, dass die 
Aufgaben das Potenzial für die Anbahnung von IKK haben. Gegenläufige oder 
abweichende Wahrnehmungen hingegen schwächten diese Annahmen, waren 
jedoch interessante Ausgangspunkte für das abschließende Gespräch mit den 
Lehrer/innen. 


Schülerbezogene Datensätze 

Die Schüler/innen bestimmen zu einem wesentlichen Teil, wie sich der task-as- 
workplan im Unterrichtsgeschehen entfaltet. In der Studie können das Schü- 
lerverhalten (Videografie) und Unterrichtserzeugnisse (wie z.B. Arbeitsblätter, 
Lernertexte) der Kinder ebenfalls genutzt werden, um das interkulturell kom- 
munikative Potenzial von Aufgaben einzuschätzen. Darüber hinaus wurden 
Fragebögen (Klassen 3 und 4) eingesetzt und Gruppeninterviews (in allen Klas- 
senstufen) geführt, um zu erfahren, wie die Schüler/innen den Unterricht wahr- 
genommen haben. 


Unterrichtserzeugnisse 

Während der Unterrichtseinheit entstanden in allen vier Klassen unterschiedli- 
che Schülerprodukte (z.B. Arbeitsblätter, E-Mails, Poster, Geburtstagskalender). 
In den beiden ersten Klassen enthalten diese primär gestalterische Elemente 
(wie z.B. der Geburtstagskalender). In den Klassen 3 und 4 geben über die ge- 
stalterischen Aspekte hinaus schriftliche Erzeugnisse (beispielweise E-Mails der 
Schüler/innen) Einsichten in interkulturell kommunikative Lernprozesse. Über 
die Schülerprodukte konnten „Einblicke in Kinderwelten“ (Mey 2003: 5) gewon- 
nen werden. 
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Fragebögen 

Am Ende der Unterrichtseinheit wurden die Schüler/innen in den Klassen 3 und 4 
gebeten, einen Fragebogen auszufüllen. In den beiden ersten Klassen wurde auf 
den Einsatz des Fragebogens verzichtet, da das Erlesen der Fragen und der Ein- 
satz der Schrift die jungen Schüler/innen überfordert hätten (vgl. ebd. 2003: 5f.). 
Die Vorteile von diesem Vorgehen sind, dass in einer sehr geringen Zeit Infor- 
mationen von vielen Personen gleichzeitig zu ein und demselben Gegenstand er- 
fragt werden können (vgl. Dörnyei 2010: 6). So konnte ein allgemeiner Überblick 
über die Meinungen, Perspektiven und die Stimmungslage der Schüler/innen in 
beiden Klassenstufen gewonnen werden. 

Bei der Entwicklung des Fragebogens wurde auf eine übersichtliche Gestal- 
tung und die richtige Lineatur für die jeweilige Klassenstufe geachtet. Insgesamt 
umfasste der Fragebogen 14 Fragen, welche die Schüler/innen auf 4 Seiten be- 
antworten sollten. Dies entspricht Dörnyeis (vgl. ebd.: 12f.) Vorgaben, denn ein 
Fragebogen sollte eine Bearbeitungszeit von 30 Minuten und den Umfang von 
4 bis 6 Seiten nicht überschreiten, da bei dieser jungen Zielgruppe die Schreib- 
und Lesekompetenzen noch nicht ausgereift sind und auch die Konzentrati- 
onsfähigkeit schnell erschöpft ist. Weiterhin ist es wichtig, eine für die Kinder 
verständliche und angemessene Sprache zu verwenden, d.h., dass die Fragen 
klar, konkret und einfach formuliert sein müssen (vgl. Mey 2003: 7). Die Fragen 
sprachen die Schüler/innen immer direkt an und fragten sie nach ihrer subjek- 
tiven Meinung. Zum einen zeigte dies den Kindern, dass ihre individuelle Mei- 
nung wichtig ist und zum anderen wurde für die Schüler/innen so auch deutlich, 
dass es eine ‚falsche‘ Antwort nicht gibt und es um ihre Wahrnehmung der Din- 
ge geht. Die ersten Fragen erfragten soziodemographische Daten der Schüler/ 
innen und erhoben ihre Meinung zu ihrem Englischunterricht. Durch den per- 
sönlichen Bezug und die Allgemeinheit der Fragen merkten die Kinder, dass sie 
die Fragen beantworten konnten und gewannen so zu Beginn Sicherheit. Diese 
stärkte sie für den weiteren Verlauf der Fragen (vgl. Dörnyei 2007: 111f.), da 
diese zunehmend spezifischer wurden. 

Der Fragebogen bestand überwiegend aus offenen Fragen, weil die Ant- 
worten auf diese mehr Detailinformationen enthalten und eventuell sogar 
Aspekte (issues) aufzeigen, die der/die Forscher/in nicht antizipiert hat. 
„[Olpen-format items can provide a greater ‚richness‘ (...) [and] yield graphic 
examples, illustrative quotes and can also lead us to identify issues not pre- 
viously anticipated“ (Dörnyei 2010: 26). Die geschlossenen Fragen enthiel- 
ten nur die beiden sehr eng gefassten Antwortmöglichkeiten ‚Ja‘ und ‚Nein, 
so dass die Schüler/innen hierbei eine Tendenz ausdrücken mussten. Es be- 
stand jedoch immer die Möglichkeit (mit einer Ausnahme), die ausgewählte 
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Option zu begründen, um so die Hintergründe für die angekreuzte Antwort 
zu erfassen. Auch wenn der Fragebogen den Schüler/innen die Möglichkeit 
bot, ihre eigenen Antworten einzubringen, war dies natürlich nur begrenzt 
möglich. Diese Begrenzung liegt in der Natur der Fragebögen an sich. Um 
mehr in die Tiefe gehen zu können, wurden zusätzlich Gruppeninterviews 
geführt. „Um die mit Fragebögen verbundenen Einschränkungen und Her- 
ausforderungen zu kompensieren, wird vielfach außerdem empfohlen, Kin- 
der zusätzlich zu interviewen, um für bestimmte Fragebereiche ergänzendes 
Datenmaterial zu erhalten, das für die Interpretation kindlicher Perspektiven 
nützlich ist“ (ebd.: 8). 


Gruppeninterviews 

Während die Fragebögen ein Meinungsbild aller Dritt- und Viertklässler 
erheben, sind Interviews besonders geeignet, um einzelne Aspekte diffe- 
renzierter zu thematisieren. Wie auch bei den Gesprächen mit den Leh- 
rer/innen sind es erneut die subjektiven Wahrnehmungen, diesmal die der 
Kinder, die im Mittelpunkt des Interesses stehen. „Interviews [eröffnen] 
(...) einen wichtigen Zugang zu kindlichem Wissen“ (Mey 2003: 8). Die 
Interviews wurden in allen Klassenstufen mit einer Auswahl an Schüler/ 
innen geführt. 

Ein leitfadengestütztes Interview strukturierte die Gespräche. Dies ist ein 
wichtiges Kriterium, denn Kinder im Grundschulalter entwickeln erst die Fä- 
higkeit, ausführlich und detailliert über Sachverhalte zu berichten. Ein narra- 
tives Interview hätte die Kinder somit überfordert (vgl. ebd.: 9). Dies besagt 
zugleich auch, dass sich die Sprechzeit des interviewenden Erwachsenen in 
einem Gespräch mit Kindern erhöht. Dies entspricht jedoch eigentlich nicht 
dem Grundgedanken eines leitfadengestützten Interviews (vgl. Mayring 2002: 
66f.). Um die Sprechzeit der Kinder zu erhöhen, wurde deshalb ein Gruppen- 
interview gewählt. „Gruppendiskussionen [erlauben] Einblicke in die jeweili- 
gen Kinderkulturen und eine Beschreibung von Kinderwelten ‚von innen’ her“ 
(Mey 2003: 13). Kinder regen sich in Gruppen gegenseitig zum Sprechen an und 
es entstehen Diskussionen, die gewünscht sind. Aus diesem Grund kann man 
eher von einem Gruppengespräch sprechen, dessen Inhalte und Richtung aber 
durch einen Leitfaden bestimmt waren. Dabei ist die Zusammensetzung der 
Gruppen wichtig. Es ist „empfehlenswert, Gruppendiskussionen in ‚Realgrup- 
pen’ durchzuführen, also in Gruppen, die unabhängig von der Untersuchung 
existieren (statt eine Gruppe zu Forschungszwecken kurzfristig und einmalig 
zusammenzustellen), um Kindern eine ihnen vertraute Atmosphäre zu bie- 
ten“ (ebd.: 13). So kamen die Schüler/innen immer mit ein bis zwei vertrauten 
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Klassenkamerad/innen zum Gespräch. Die Gruppengröße aller Interviews lag 
zwischen zwei und drei Kindern. In jeder Klasse stand die letzte Schulstunde 
der Unterrichtseinheit zur Verfügung, in der zwei Gruppen à 20 Minuten inter- 
viewt werden konnten. Alle Schülerinterviews wurden mit einer Videokamera 
aufgezeichnet, um zusätzlich zu den verbalen Aussagen, non-verbale Reaktio- 
nen mit erfassen zu können. 

„Auf inhaltlicher Ebene kann u.a. beobachtet werden, welche Erfahrungen 
und welches Wissen Kinder zu einem Thema beitragen und mit welchen Ar- 
gumenten sie ihre Ausführungen stützen. Das gibt auch einen Einblick in die 
Orientierungsmuster, mit denen sie ihre Alltagserfahrungen selbst einordnen 
und deuten“ (Billmann-Mahecha 2001: 14). Dabei müssen die Fragen, wie 
bei den Fragebögen, im Gespräch einen Bezug zu der direkten Lebenswelt 
aufweisen und klar formuliert sein. Aus diesem Grund wurden zwei unter- 
schiedliche Leitfäden für die ersten beiden Klassen und die Klassen 3 und 4 
konzipiert. 


4. Zusammenfassung, Schlussfolgerungen 
und Ausblick 


Die Forschungsarbeit hat das Ziel, theoretische und praktische Erkenntnisse 
in Bezug auf die Anbahnung von IKK im Englischunterricht der Grundschule 
hervorzubringen. Da in diesem Feld bisher nur sehr wenige empirisch über- 
prüfte Erkenntnisse vorliegen, wurde ein qualitatives Forschungsdesign ge- 
wählt, welches sich der Thematik explorativ-interpretativ nähert. Anhand von 
vier Fallstudien sollen Möglichkeiten und Grenzen der Vermittlung von IKK 
im Grundschulkontext aufgezeigt werden. Die Forschungsarbeit erhebt jedoch 
nicht den Anspruch, diese Erkenntnisse als wissenschaftliche Hypothesen zu 
präsentieren. Denn dadurch, dass sich die Studie auf vier konkrete Fälle so- 
wie deren Rahmenbedingungen, Akteure und Handlungsverläufe bezieht, gel- 
ten die gewonnenen Erkenntnisse speziell für diese und sind eigentlich nicht 
generalisierbar (vgl. Schocker-von Ditfurth 2001: 106). Allerdings kann „aus 
dem Besonderen des Einzelfalls durchaus Allgemeines [...] entstehen“ (Fatke 
2010: 168). „Der Geltungsbereich einer Studie und damit auch der Grad ihrer 
Generalisierbarkeit wird deshalb zunächst von der Vergleichbarkeit der Kon- 
texte abhängen, für die die Ergebnisse der Studie herangezogen werden“ (Drese 
2007: 214). Die Rezipienten (Forscher/innen und Lehrer/innen) dieser For- 
schungsarbeit können dann individuell prüfen, inwiefern die Ergebnisse der 
Forschungsarbeit auch für den Kontext, der sie betrifft bzw. in dem sie tätig 
sind, relevant sind. 
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Methoden videogestützter 
Beobachtungsverfahren in der 
Lehr-Lern-Forschung 


Johannes Appel / Udo Rauin 


Mit wachsenden technischen Möglichkeiten erweist sich die Nutzung von 
Videoaufnahmen zunehmend als praktikable Erweiterung des Methodenreper- 
toires zur Erforschung von Unterricht. Beobachtungsstudien sind heute durch 
die Flexibilität des Datenmaterials weitaus vertiefter möglich, als es die klassische 
direkte Beobachtung im Klassenraum erlaubt. Neben Aspekten der Forschungs- 
pragmatik liegen die Vorteile besonders in Möglichkeiten der Kombination 
von Videodaten mit alternativ erhobenen Datenquellen, wie Befragungen oder 
Tests, um umfassendere Einblicke in das komplexe Geschehen im Unterricht 
zu ermöglichen. In diesem Beitrag werden neben einem Überblick zu Vor- und 
Nachteilen und methodischen Grundlagen des Zugangs zentrale Verfahren der 
Auswertung von audiovisuellen Unterrichtsaufzeichnungen dargestellt und 
Triangulationspotenziale - insbesondere der Datentriangulation - aufgezeigt. 
Zur Veranschaulichung werden Beispieldaten aus einem eigenen Forschungs- 
projekt herangezogen. 


1. Videografie in der Unterrichtsforschung 


Ihre Anfänge hat die videogestützte Unterrichtsforschung in den 1970er Jahren, 
als Technologien zum Anfertigen und Abspielen von Videoaufnahmen tech- 
nisch einfach realisierbar und vergleichsweise kostengünstig wurden. Zu den 
Pionieren dieses Zugangs zählen beispielsweise Raymond S. Adams und Bruce 
J. Biddle, die bei ihrer Arbeit zum Interaktionsgeschehen zwischen Lehrern 
und Schülern die damals gängige direkte Beobachtung im Klassenraum als zu 
eingeschränkt und ungenau empfanden und daher mit Videoaufnahmen arbei- 
teten (Adams/Biddle 1970). Auch Jacob S. Kounin, der zur Untersuchung des 
classroom managements nach Möglichkeiten zur Erweiterung der Beobachtung 
im Klassenraum suchte und aus diesem Grund so genannte „Video-Recorder- 
Studien“ durchführte (Kounin 1976), gilt als einer der Pioniere im Bereich der 
videogestützten Unterrichtsforschung. Die zentralen Vorteile, die man von Be- 
ginn an in der Verwendung von Videoaufnahmen sah, werden im Wesentlichen 
bis heute angeführt (vgl. Biddle 1967, Adams/Biddle 1970, Kounin 1976, Jacobs 
etal. 1999, Aufschnaiter/Welzel 2001, Petko et al. 2003, Dinkelaker/Herrle 2009, 
Pauli/Reusser 2006) und werden nachfolgend ausführlich dargelegt. 


60 Johannes Appel / Udo Rauin 


Ein großer Vorteil ergibt sich aus der Tatsache, dass Videodaten einen wieder- 
holten Zugriff auf das audiovisuelle Geschehen der Klassensituation zulassen. So- 
mit werden mehrere und voneinander unabhängige Analysen des Materials mit 
unterschiedlichen analytischen Zugängen und Fragestellungen ermöglicht. Dies 
erscheint zum einen unter methodologischen Gesichtspunkten interessant, weil 
auf diese Weise die Erprobung und der Vergleich von Beobachtungsinstrumen- 
tarien vereinfacht wird, und zum anderen Datenbestände aufgebaut werden kön- 
nen, die sich zur Nutzung in Forschungsverbünden oder für Sekundäranalysen 
anbieten. Erfüllen die Aufnahmen bestimmte Standards der Bild- und Tonqua- 
lität, besteht zudem ein weiterer Nutzen darin, dass die Daten durch Techniken 
wie Vor- und Zurückspulen, Zeitlupe oder Zoom tieferen Analysen zugänglich 
gemacht werden, als es dem menschlichen Beobachter unter normalen physikali- 
schen Bedingungen möglich wäre. Das bezieht sich sowohl auf meist unbemerkte 
Ereignisse im Klassenraum (z.B. Briefchen unter dem Tisch, Gesten von Schülern), 
als auch auf die Gleichzeitigkeit verschiedener Handlungen in der Unterrichtssitu- 
ation, die sich in ihrer Fülle und Komplexität der Aufmerksamkeit eines einzelnen 
Beobachters zwangsläufig entziehen. Videoaufnahmen ermöglichen somit zwar 
einen hohen Informationsgehalt und eine hohe Genauigkeit der Daten zu jenem 
Ausschnitt des Unterrichtsgeschehens, der in der Erhebungssituation fokussiert 
wird. Allerdings bleiben durch die unumgänglichen Selektionsentscheidungen 
im Rahmen der Aufzeichnungen notwendigerweise immer Aspekte des Gesche- 
hens unberücksichtigt, die mitunter - je nach Forschungsinteresse - auch durch 
teilnehmende Beobachtungen zugänglich gemacht werden können, wie beispiels- 
weise Gesten, Äußerungen, Bewegungen außerhalb des Kamera- und Mikrofonbe- 
reichs oder schlicht Geruchs- und Temperaturwahrnehmungen in der jeweiligen 
Situation (Dinkelaker/Herrle 2009). Darüber hinaus besteht ein entscheidender 
Vorteil der Nutzung von Videodaten darin, dass durch die Trennung der appa- 
rativ basierten Datenerhebung und der zu einem späteren Zeitpunkt von den 
Forschenden vollzogenen Analyse eine klare Trennung zwischen Protokollierung 
und Interpretation der Ereignisse geschieht. Dadurch ist eine erhöhte Genauigkeit 
der Einschätzungen bei gleichzeitiger Reduzierung von Fehlentscheidungen mög- 
lich, weil beim Vorgang der Identifizierung und Bewertung der Ereignisse weder 
besonderer Zeitdruck besteht, noch kognitive Einschränkungen des Beobachters 
aufgrund von Ablenkungen oder „einem schlechten Tag“ zu befürchten sind. 

Neben diesen Vorteilen weiß man aufgrund der mittlerweile großen Anzahl von 
Videostudien der letzten Jahrzehnte auch um einige Herausforderungen, die man 
bei der Planung des Forschungsprozesses bedenken sollte (vgl. Seidel et al. 2003, 
Wild 2003, Dinkelaker/Herrle 2009). So ist bereits im Vorfeld die datenschutz- 
rechtliche Absicherung zu beachten, zu der schriftliche Einverständniserklärungen 
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aller abzubildenden Personen bzw. ihrer Erziehungsberechtigten, inkl. der zustän- 
digen Behörde (Schulleitung, Schulamt) einzuholen sind. Solche Vorgänge kön- 
nen durch bereits bestehende Kooperationen zu den Schulen bzw. Schulträgern 
unter Umständen erheblich erleichtert werden, sollten jedoch hinsichtlich des 
Aufwands und der Bedeutung nicht unterschätzt werden. Eine weitere Heraus- 
forderung besteht in der Realisierung eines tragfähigen Untersuchungsdesigns. So 
kann die Qualität der Stichprobe - mit Blick auf die jeweilige Fragestellung - durch 
organisatorische Einschränkungen der Datenerhebung beeinträchtigt werden (z.B. 
Verteilung von Personen- oder Gruppenmerkmalen in den zugänglichen Lern- 
gruppen, gewünschte Klassenstufe oder Unterrichtsfach nicht verfügbar usw.). 
Nach Abschluss der Vorarbeiten erfordert die Anfertigung der Videoaufnahmen 
eine Reihe von Erwägungen, die sich aus dem Zusammenspiel technisch- 
organisatorischer und methodischer Gesichtspunkte ergeben. Denn möchte man 
eine möglichst umfassende Abbildung des Geschehens bei gleichzeitig hoher 
Qualität der Video- und Audioaufnahmen erzielen, ist der Einsatz entsprechend 
hochwertiger Geräte in ausreichender Anzahl notwendig. Beispielsweise sind für 
viele Untersuchungsgegenstände und Fragestellungen mindestens zwei Kamera- 
perspektiven erforderlich, die im Falle variierender Raum- oder Gruppenanord- 
nungen gegebenenfalls um zusätzliche Perspektiven erweitert werden müssen. Mit 
dem Anstieg des technischen Erhebungsaufwandes verstärkt sich allerdings die un- 
erwünschte Beeinflussung des zu erforschenden Feldes und der darin agierenden 
Personen durch so genannte Invasivitätseffekte (vgl. Petko et al. 2003: 270, Bortz/ 
Döring 2006: 268), so dass die Datengrundlage zwar technisch an Qualität gewin- 
nen mag, zugleich aber auf Grund möglicher Verzerrungen die Validität leiden 
kann. Abschließend kann die Aufbereitung der Daten je nach Aufnahmequalität, 
verfügbarer Hard- und Software und erwünschten Zieleigenschaften des Daten- 
bestandes mit einem immensen Aufwand verbunden sein. Der Zugang videoge- 
stützter Beobachtungen von (Schul-) Unterricht ist somit zwar aus planungs- und 
organisationstechnischer Hinsicht voraussetzungsreich, gleichzeitig aber hinsicht- 
lich methodischer als auch theoretischer Möglichkeiten äußerst vielversprechend. 
In der zeitgenössischen empirischen Unterrichtsforschung gehören Verfahren 
der systematischen Beobachtung unter Nutzung audiovisueller Aufnahmen mitt- 
lerweile zum gängigen Methodenrepertoire (vgl. Böhm-Kasper/Weishaupt 2004, 
Klieme 2006). Besonders durch Forschungsprojekte wie TIMSS', DESI (Helmke 
et al. 2008), der international-schweizerischen Videostudie (Reusser et al. 2010), 


1  http://timssvideo.com/timss-video-study 
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der IPN-Videostudie? oder aktuell auch PERLE? und IGEL* hat die Verbreitung 
dieses Ansatzes im deutschsprachigen Raum in den letzten Jahren stark zugenom- 
men, sodass auch methodologische Überlegungen, wie zum Beispiel zur Rolle der 
Videoforschung in gemischten Forschungsdesigns, verstärkt Eingang in den hiesi- 
gen wissenschaftlichen Diskurs finden. Möchte man den Erfolg oder die Effektivi- 
tät der Lernumgebung oder des Lehrerhandelns bestimmen, dann reicht es nicht 
aus, diskursanalytisch den Text der Hauptakteure zu betrachten oder lediglich Test- 
daten und Unterrichtsmethoden in Beziehung zu setzen. Neuere Studien nutzen 
eine Vielzahl von Variablen der Instruktionsqualität (z.B. Time on Task), der Schü- 
lereigenschaften (z.B. das sprachliche Vorwissen) und des Settings (z.B. das Fach- 
wissen der Lehrkraft) gleichzeitig, die entweder über Beobachtungsverfahren, Tests 
oder Befragungen erhoben worden sind. Diesbezüglich zeigt Abb. 1 beispielhaft 
ein Modell, in dem sich das Potential der Kombination von Erhebungsverfahren 
unter Einbezug von Videoanalysen andeutet: Dargestellt wird das Bedingungsgefü- 
ge zur Förderung der Lesefähigkeit auf unterschiedlichen Ebenen nach Connor et 
al. (2009: 87), welches besonders im Bereich der multiple dimensions of instruction 
einen Zugang über Verfahren videogestützter Beobachtung anbietet. 


Abb. 1: Modell der Unterrichtsbedingungen zur Entwicklung der Lesefähigkeit (Connor et al. 
2009: 87) 
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2  http://www.ipn.uni-kiel.de/projekte/video/ 
http://www.perle-projekt.de/ 
4  http://www.idea-frankfurt.eu/wissen/projekte/projekt-igel 
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Im Folgenden werden Ansätze videobasierter Beobachtungsstudien von Unterricht 
unter Berücksichtigung sowohl grundlegender methodischer Aspekte als auch ver- 
schiedener Möglichkeiten zur Triangulation anhand von Beispielen dargestellt. 


2. Beobachten als sozialwissenschaftliches Verfahren 
der Datengewinnung 


Triangulation kann in der erziehungswissenschaftlichen Forschung Verschiede- 
nes bedeuten (vgl. Flick 2011). In diesem Artikel wird darunter in Anlehnung 
an die bis heute anerkannte Systematisierung von Denzin (1978) hauptsächlich 
eine Triangulation zwischen verschiedenen Datenquellen und Methoden ihrer 
Auswertung (between-method) verstanden. Diese Verfahrensweise dient unter- 
schiedlichen Zwecken, wie im weiteren Verlauf noch an Beispielen zu zeigen ist. 

In der Regel werden fünf quantitative Methoden der Datenerhebung unter- 
schieden (vgl. Bortz/Döring 2006): 


e Zählen (z.B. Index, Quantitative Inhaltsanalyse) 

« Testen (z.B. Leistungstest, Persönlichkeitstest, usw.) 

e Befragen (z.B. mündliches Interview, schriftlicher Fragebogen usw.) 
e Physiologisches Messen (z.B. Pulsfrequenz etc.) 

e Beobachten (z.B. Zeitstichprobe des Verhaltens). 


In diesem Beitrag beschäftigen wir uns mit dem Beobachten im Rahmen von Video- 
projekten. Mit diesem Verfahren werden Beobachtungsdaten produziert, diezu einem 
späteren Zeitpunkt z.B. mit Befragungs- oder Testdaten verknüpft werden können. 

Grundsätzlich verstehen wir unter Verhaltensbeobachtung die auf das Verhal- 
ten eines oder mehrerer Organismen (Beobachtungsobjekte) gerichtete Wahr- 
nehmung einer oder mehrerer Personen (Beobachter) mit dem Ziel, Wesentliches 
oder Symptomatisches über das Verhalten des bzw. der beobachteten Organis- 
men oder über ihre Interaktion zu erfahren. Beabsichtigt ist die Herstellung eines 
möglichst intersubjektiv nachvollziehbaren Verhaltensprotokolls. In Videoanaly- 
seprogrammen sind das in der Regel Datenreihen, die sich entlang einer Zeitach- 
se anordnen lassen und mit Audio- oder Videosequenzen verbunden sind. 

Worin sich unsere Alltagsbeobachtung von wissenschaftlichen Beobachtun- 
gen unterscheidet, wird an vielen Stellen (Gerrig/Zimbardo 2008) ausführlich 
dargelegt. Während Alltagsbeobachtung nach situativen und individuellen Prä- 
ferenzen mehr oder weniger beliebig vonstatten geht, setzt die systematische Be- 
obachtung einen genauen Beobachtungsplan voraus, der vorschreibt 


e was (und bei mehreren Beobachtern auch von wem) zu beobachten ist, 
e was für die Beobachtung unwesentlich ist, 
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e wann und wo die Beobachtung stattfindet und wie das Beobachtete zu proto- 
kollieren ist (z.B. live oder durch Video), 

e ob bzw. in welcher Weise das Beobachtete gedeutet werden darf (angestrebter 
Grad der Trennung von Daten und Bewertungen). 


Videografie ist eine Variante der instrumentellen Beobachtung, die zwischen den 
Daten, die ein Aufnahmeteam (Video- und Audiodaten, Transkripte, Materiali- 
en: Arbeitsblätter, Tafelbilder etc.) - auch hier schon selektiv (s.o.) - erfasst, und 
den Auswertungen durch Beobachter im Nachgang der Erhebung unterscheidet. 
In der Regel handelt es sich aus Gründen der ökologischen Validität’ um Feldbe- 
obachtungen in typischen Settings (z.B. Unterricht im Klassenzimmer), möglich 
wären aber auch experimentelle Designs im Labor. 

Grundsätzlich unterscheiden wir bei der Auswertung zwischen Verfahren des 
Beurteilens oder des Kodierens. 


2.1 Beurteilungsverfahren oder Ratings 


Für den ersten Zugang werden sogenannte Ratingskalen genutzt, welche die 
nachträgliche Einschätzung eines Ereignisses oder Zeitraums anhand von Items 
mit Antwortvorgaben erlauben. Im Grunde unterscheidet sich das Procedere 
nur wenig von ähnlichen Verfahren der teilnehmenden Beobachtung. Vorteil- 
haft ist hierbei jedoch, dass mehrere Beobachter unabhängig von einander das 
gleiche Video einschätzen können, so dass im Unterschied zur Livebeobach- 
tung die Interrater-Reliabilität, das heißt die Übereinstimmung zwischen Ur- 
teilen verschiedener Personen (vgl. Wirtz/Caspar 2002), relativ leicht bestimmt 
werden kann. Darüber hinaus eignet sich diese Vorgehensweise aufgrund ihrer 
Praktikabilität zur Analyse von großen Stichproben, bringt allerdings auch ge- 
wisse Schwächen mit sich, die an einem Beispiel verdeutlicht werden sollen. 


Beispiel 1: Die Beurteilung von Unterrichtsqualität 

Das folgende Item (Tab. 1) entstammt einem Ratingbogen zur Beurteilung von 

Aspekten der Unterrichtsqualität, welcher u.a. im Rahmen der so genannten 

„Münchener Hauptschulstudie“ (Helmke/Schrader 1993, 1997) und später in 

modifizierter Form in der DESI-Studie verwendet wurde (Helmke et al. 2008). 
Ratings sind zwar relativ einfach anwendbar und bei hinreichender Schu- 

lung der Rater auch mit guter Übereinstimmung zu erstellen, haben aber den 


5 Die so genannte ökologische Validität steht für den Grad der Generalisierbarkeit der 
Untersuchungsergebnisse aufgrund der „Natürlichkeit der Untersuchungssituation“ 
(Bortz/Döring 2006: 727). 


Methoden videogestützter Beobachtungsverfahren in der Lehr-Lern-Forschung 65 


Nachteil, dass komplexe Beurteilungsvorgänge der Beobachter in einem einzigen 
Wert verdichtet sind. Es ist für Dritte anhand der protokollierten Daten nicht re- 
konstruierbar, weshalb die Äußerungen einer Lehrkraft in einer bestimmten Un- 
terrichtssequenz (siehe Beispiel) mit „geringe Verständlichkeit“ und nicht mit 
„mäßige Verständlichkeit“ bewertet wurden. 


Tab. 1: Ausschnitt aus einem Ratingbogen zur Unterrichtsqualität (Helmke/Schrader 1993, 1997) 


7. Verständlichkeit von Lehreräußerungen 

Verständlichkeit bezieht sich darauf, inwieweit die Darstellung des Lehrstoffs durch 
den Lehrer und seine sonstigen fachliche Äußerungen von den Schülern verstanden 
wurden. Wie verständlich waren die Erläuterungen des Lehrers? 


sehr hohe Die Erklärungen des Lehrers waren leicht zu verstehen und 
Verständlichkeit die Fragen der Schüler wurden angemessen beantwortet. Der 
Lehrer schien die unterschiedlichen kognitiven Fähigkeiten 
der Schüler zu kennen. Er bemühte sich erfolgreich, Stoff zu 
erklären, mit dem die Schüler Schwierigkeiten hatten. 


hohe Verständlichkeit | Zwischen 1. und 3. Kategorie. 


mäßige Verständlichkeit | Der Lehrer schien von den meisten Schülern verstanden zu 
werden, wenn auch nicht die ganze Zeit über. Manchmal 
wirkte der Lehrer verwirrend und undeutlich. 


geringe Verständlichkeit | Zwischen 3. und 5. Kategorie 


sehr geringe Die Schüler schienen durch die Darstellung des Lehrers sehr 
Verständlichkeit verwirrt zu werden. Der Lehrer konnte die Fragen der Schü- 
ler nicht erfolgreich beantworten oder er beantwortete sie un- 
klar, indem er Begriffe oder Fachausdrücke verwendete, mit 
denen die Schüler offenbar nicht vertraut waren, oder indem 
er sich übermäßig kompliziert und undeutlich ausdrückte. 


2.2 Kodierverfahren 


Kodierverfahren setzen im Unterschied zu Ratings auf die möglichst genaue 
Protokollierung der vorab theoretisch definierten Ereignisse, Abläufe oder In- 
teraktionen. Mit ihnen wird die Entwicklung von reproduzierbaren Beobach- 
tungsprozeduren angestrebt, die den Beurteilungsspielraum der Beobachter 
stark eingrenzen. Grundsätzlich können (a) Zeichensysteme und (b) Kategori- 
ensysteme unterschieden werden. Beide Systeme können entweder über Ereig- 
nis- oder Zeitstichproben Daten erfassen. 


(a) Zeichensysteme für Ereignisstichproben oder Zeitstichproben 

Kodieren kann durch einfache Zeichensysteme erfolgen. Darunter versteht man 
Listen von vorgegebenen Ereignissen, die bei Auftreten mit oder ohne Dauer no- 
tiert (z.B. Melden, Störungen) und auf der Videozeitachse festgehalten werden. 
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Zeichensysteme ermöglichen die genaue Beobachtung einer großen Anzahl ver- 
schiedener, singulärer und exakt definierter Verhaltensweisen. Sie können dann 
verwendet werden, wenn die zu beobachtenden Verhaltensweisen als individu- 
elle Ereignisse (Ereignisstichprobe) sequenziell auftreten. 


Beispiel 2: Die Erfassung von Sprachanteilen 

Das Fundament von Unterricht basiert auf Kommunikation und Interaktion zwi- 
schen den Beteiligten, sodass dessen Erforschung entsprechende Aspekte berück- 
sichtigen muss (vgl. Lüders 2003). Nicht nur aus Sicht der Fremdsprachendidaktik 
ist dabei die verbale Kommunikation von Interesse. Zugänglich wird dieser Bereich 
durch Audioaufnahmen, die dann entweder in schriftliche Transkriptionen über- 
führt und dadurch für weitere, textanalytischen Methoden verfügbar gemacht wer- 
den (vgl. Wernet 2009), oder durch die direkte Verbindung der Aufnahmen mit 
Videoaufzeichnungen derselben Situation. Mit dem letztgenannten Verfahren sind 
verschiedene Vorteileverbunden, auch im Hinblick aufdie Triangulation. Die Lehrer- 
und Schülersprache im Unterricht kann als sequenzielle Abfolge von einzelnen 
Sprechakten interpretiert werden, die durch eine Ereignisstichprobe anhand der au- 
diovisuellen Aufnahmen erfassbar sind. Dies lässt sich unter Verwendung gängiger 
Analyse- und Auswertungsprogramme komfortabel durchführen‘. Das Ergebnis ist 
ein präzises sequenzielles Protokoll der Sprachanteile inklusive ihrer Anfangs- und 
Endzeitpunkte, technisch verknüpft mit dem Videodokument (vgl. Tab. 2). 


Tab. 2: Datenstruktur einer Ereignisstichprobe zu Sprachäußerungen im Unterricht 


Anfang Ende Ereignis 

00:00:10:04 00:00:13:09 Sprache Lehrperson 
00:00:13:09 00:00:15:01 Sprache Lehrperson 
00:00:15:05 00:00:16:17 Sprache Schueler/inl 
00:00:16:17 00:00:18:06 Sprache Schueler/in2 
00:00:18:23 00:00:21:08 Sprache Schueler/in3 
00:00:25:13 00:00:27:13 Sprache Schueler/in4 
00:00:27:13 00:00:28:16 Sprache Lehrperson 
00:00:29:01 00:00:29:20 Sprache Schueler/in2 
00:00:30:04 00:00:36:12 Sprache Schueler/in5 
00:00:36:22 00:00:40:14 Sprache Schueler/in6 


Anm.: Zeitangaben im Format: Stunden:Minuten:Sekunden:Bild-Frames 


6 Z.B.mitdem Zusatzmodul Soundalyzer der Software Interact (Mangold International) 
vollständig automatisiert. 
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Zeichensysteme sind sehr einfach zu konstruieren, da man lediglich eine Liste 
der erwarteten Ereignisse und eine entsprechende Verfahrensvorschrift benötigt, 
welche die Ereignisse identifizierbar macht. Diese Ereignisse bzw. Verhaltens- 
weisen (Ereignisstichprobe) können nun in weiteren Schritten beliebig oft nach 
unterschiedlichen Kriterien mit Bedeutung belegt bzw. klassifiziert werden - 
sei es hinsichtlich formaler Sprachmerkmale (Deutsch/Englisch/Französisch/ 
etc.) oder des pädagogischen Handelns (Störungsintervention, Adressat in der 
Gruppe, Aktivitätsaufforderung etc.). Zeichensysteme haben jedoch den Nach- 
teil, dass die erfassten Daten nur eingeschränkt interpretiert werden können. 
So lassen z.B. die Sprachereignisse nicht unmittelbar eine Berechnung des 
Redeanteils der Personengruppen am Unterricht zu, da die Ereignisse auch par- 
allel stattfinden können (manchmal reden mehrere Personen im Klassenzimmer 
gleichzeitig), d.h. sie sind nicht notwendig exklusiv erfasst. Ein bestimmter Teil 
der Zeit wird zudem nicht erfasst, weil keine Ereignisse der definierten Liste 
stattfinden, d.h. die Kodierung ist nicht exhaustiv. Will man dagegen den Ereig- 
nisraum in einer Dimension vollständig darstellen, um auch relative Anteile zu 
bestimmen und weitere Vergleiche mit den Daten durchführen zu können, dann 
sind Kategoriensysteme die bessere Wahl. 


(b) Kategoriensysteme 

Kodiert wird dann durch kategoriale Zuordnung von Ereignissen oder Zeiträu- 
men zu vorab theoretisch bestimmten Konstrukten (z.B. Unterrichtsphasen, 
Unterrichtsstile, Reaktionsweisen). Zu diesem Zweck werden Kategoriensys- 
teme unter Beachtung dreier Prinzipien erzeugt (Bortz/Döring 2006: 140): (1) 
Genauigkeit, (2) Exklusivität und (3) Exhaustivität. Gemeint sind damit theo- 
retische Begriffssysteme, die den Anspruch auf eine vollständige (3) Kodierung 
aller erwartbaren Verhaltensweisen in einer bestimmten Situation haben und 
gleichzeitig eine eindeutige (1) und überlappungsfreie (2) Kodierung der Objek- 
te vornehmen. Ein einfaches Kodiersystem für rote, grüne und blaue Bälle wäre 
demnach nur solange eindeutig, wie es im Vorrat der vorhandenen Bälle kei- 
ne rot-grün-gestreiften gäbe. Kategoriensysteme sind deshalb selten universell 
einsetzbar, sondern sind meistens an bestimmte Spezifika des Verhaltens in der 
jeweiligen Situation und Institution gebunden. 


Beispiel 3: Phasen des Unterrichts 

Oftmals werden Merkmale des Unterrichtsgeschehens in den Blick genom- 
men, die kaum dem Verhalten einzelner Personen im Klassenraum zuzu- 
ordnen und eher übergeordneter Natur sind. Besonders die Frage nach der 
Lage und Dauer von bestimmten Unterrichtsphasen wird immer wieder in 


68 Johannes Appel / Udo Rauin 


verschiedenen Zusammenhängen gestellt, etwa, um unterschiedliche Mus- 
ter des Unterrichtsverlaufs zu identifizieren oder spezifische Phasen für ge- 
nauere Betrachtungen herauszugreifen (vgl. Seidel 2003a). Soll zum Beispiel 
die Segmentierung des Unterrichts aufgezeigt werden, ist es bedeutsam, die 
genauen Anfangs- und Endpunkte der unterschiedlichen Phasen zu kennen. 
Dies ist durch eine Ereignisstichprobe mit Dauer erreichbar (vgl. Seidel et 
al. 2003). Die Schwierigkeit bei diesem Beobachtungsplan besteht darin, die 
fokussierten Ereignisklassen vorab so präzise zu beschreiben, dass sowohl 
Anfangs- als auch Endpunkte für den Beobachter klar und unmissverständ- 
lich erkennbar sind, um die Ereignisse definieren zu können. Werden die Er- 
eignisse innerhalb dieser erfassten Zeiträume kategorial kodiert, sind zudem 
die beschriebenen Prinzipien zu erfüllen. In unserer Studie wenden wir ein 
Beobachtungssystem zur Abbildung von Phasen mit verschiedenen Sozialfor- 
men an, welches dies veranschaulicht. Es werden folgende Kategorien unter- 
schieden (Tab. 3): 


Tab. 3: Kategoriensystem zur Bestimmung von Sozialformen im Unterricht 


Kategorie Kurzbeschreibung 


Öffentlicher Unterricht (ÖU) | primärer Aufmerksamkeitsfokus bei Lehrperson oder 
legitimem Sprecher 


Einzelarbeit (EA) Schüler beschäftigen sich alleine mit Arbeitsauftrag; 
keine öffentliche Kommunikation 

Partnerarbeit (PA) Schüler beschäftigen sich zu zweit mit Arbeitsauftrag; 
keine öffentliche Kommunikation 

Gruppenarbeit (GA) Schüler beschäftigen sich in Gruppen (G >1) mit 

Arbeitsauftrag; keine öffentliche Kommunikation 
Uneinheitliche Sozialform Parallele Nutzung von PA, EA oder GA zum gleichen 
Zeitpunkt 


Tab. 4: Datenstruktur einer Kodierung von Sozialform-Phasen aus einer beispielhaften 
Unterrichtsstunde (Format der Zeitangaben: hh:mm:ss) 


Anfang Ende Sozialform 
00:00:10 00:06:48 ÖU 
00:06:48 00:13:11 GA 
00:13:11 00:26:26 ÖU 
00:26:26 00:36:27 EA 
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Im Falle der Kategorie des „öffentlichen Unterrichts“ sind Anfangs- und End- 
zeitpunkte aufgrund von verbalen oder non-verbalen Signalen der Lehrperson 
in der Regel gut definierbar, wohingegen besonders jene Phasen, die eine Verän- 
derung des Klassen-Settings implizieren (Platzwechsel etc.), schwer zu verorten 
sind, da sie meist mit einer Art organisatorischer Übergangsphase verbunden 
sind und klare Signale der Lehrkraft mitunter ausbleiben. Weitere mögliche Kon- 
flikte des Kodierens können auch in der Abgrenzung zwischen den Kategorien 
(z.B. Partner- vs. Gruppenarbeit) entstehen (Prinzip der Exklusivität, s.o.). Da- 
her sind genaue Kriterien erforderlich, die in schriftlichen Kodieranweisungen 
oder einem Beobachterhandbuch fixiert sein sollten. Außerdem sollten mehrere 
Kodierpersonen eingesetzt werden, um Beobachterübereinstimmungen sowohl 
hinsichtlich der Vergabe der Kategorien, als auch der Setzung der Zeitmarken 
für Anfangs- und Endpunkte’ prüfen zu können. Sind diese Dinge sicher gestellt 
und die Daten erhoben, liegt schließlich eine wie in Tab. 4 abgebildete Daten- 
struktur vor. 

Diese Angaben können nun als Ausgangspunkt für vertiefte Analysen dienen, 
um etwa bestimmte Segmente genauer in den Blick zu nehmen, was im Folgen- 
den anhand eines Beispiels verdeutlicht wird. Des Weiteren können sie in Form 
von aggregierten deskriptiven Statistiken über mehrere Unterrichtsstunden oder 
Schülergruppen hinweg direkt in Auswertungen überführt werden. 

Über diese Herangehensweise hinaus kann man Beobachtungsdaten auch als 
zusammenfassende Bewertung einer Menge von Ereignissen über einen länge- 
ren Zeitraum (Zeitstichprobe) gewinnen. Das ist immer dann sinnvoll, wenn das 
Geschehen von überlappenden, komplexen Ereignissen oder Verhaltensweisen 
geprägt ist (z.B. Handlungen von 20 Schülern), die zu einem späteren Zeitpunkt 
mit anderen Daten des gleichen Zeitpunkts (z.B. den Aktionen des Lehrers) in 
Beziehung gesetzt werden sollen. Die gesamte Beobachtungszeit wird dazu in 
Intervalle eingeteilt und für jedes Intervall wird eine Kodierung pro Beobach- 
tungseinheit durchgeführt. Intervallbasierte Zeitstichproben strukturieren die 
Ereignisse also nach einem festgelegten Zeitraster, das über den Beobachtungs- 
zeitraum gelegt wird. Damit werden Ereignisse geschaffen, die auf künstlichem 
Wege zeitlich parallelisiert sind, was die Erfassung und Auswertung komplexer 
Merkmale vereinfacht. Das tatsächliche Auftreten mit natürlichem Anfangs- und 
Endpunkt wird damit allerdings nicht abgebildet. Hier soll als Beispiel für die 
Beobachtung von Zeitstichproben die Variable Time on Task erläutert werden. 


7 Zur Berechnung entsprechender Kennwerte sei an dieser Stelle auf das Werk von 
Wirtz/Caspar (2002) verwiesen. 
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Beispiel 4: Die Beobachtung von Time on Task 

In Anlehnung an Bloom (1974) wird Time on Task als ein Maß für Engagement 
betrachtet, das Einblicke in das Tätigkeitsprofil von Schülern über den Stun- 
denverlauf ermöglicht. Dahinter steht eine einfache Überlegung: Nur dann, 
wenn Schüler ein Lernangebot nutzen, also on-task sind, wird man intentio- 
nales Lernen erwarten dürfen. Bei einer Beschäftigung mit unterrichtsfernen 
Dingen (Störungen, Privatgespräche etc.) sollte dagegen die Lernzeit ungenutzt 
bleiben. 

In unserer Forschung verwenden wir dazu ein selbst entwickeltes System zur 
Erfassung des Beteiligungsverhaltens der Schüler auf Individualebene mithilfe 
einer Zeitstichprobe. Eine Zeitstichprobe bietet den Vorteil, dass eine für 
alle beobachteten Personen gemeinsame Metrik geschaffen wird, die später eine 
Reihe von Analysen und Verknüpfungen mit anderen Zeitreihen erlaubt. Die 
Zeitstichprobe basiert in unserem Fall auf Intervallen von einer Minute, so dass 
zu jedem Schüler für jede Minute der in den Blick genommenen Phasen des 
Unterrichts eine Beurteilung des Beteiligungsverhaltens vorliegt. Die Entschei- 
dung über die Länge des Intervalls ist durchaus heikel und muss sorgfältig ge- 
prüft werden. Wählt man ein sehr kurzes Intervall, dann steigt die Anzahl der 
notwendigen Beobachtungsdaten stark an, so dass der Erhebungsaufwand an 
die Grenze der Praktikabilität stößt. Wählt man ein zu langes Intervall, dann 
können Verhaltensweisen in einem Intervall so stark wechseln, dass eine ein- 
heitliche Bewertung des Intervalls unmöglich wird. Die Beurteilung geschieht 
in unserem System auf der Basis von fünf Indikatoren, die in der Summe das 
Gesamturteil on- oder off-task bestimmen (Tab. 5). Durch die Einbeziehung der 
Indikatoren soll unerwünschten Urteilsverzerrungen (z.B. durch „Abfärben“ 
eines Globaleindrucks auf Urteile zu Einzelmerkmalen) vorgebeugt werden. 
Das Entscheidungsschema ist auf allen Stufen dichotom, d.h. werden die Ein- 
schätzungen der Hilfsindikatoren mehrheitlich im Sinne von on- oder off-task 
bewertet, dann wird das Verhalten innerhalb des betreffenden Zeitintervalls 
entsprechend eingestuft. 


Tab. 5: Beurteilungssystem zum Beteiligungsverhalten von Schülern im Unterricht 


Verhaltensindikatoren Blickrichtung - + 
Aktive Beteiligung - + 
Andere Tätigkeit = + 
Motorische Unruhe - + 
Kommunikation = + 
Gesamturteil off-task | on-task 
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Unser Vorgehen verlangt zwar eine Vielzahl an Kodierentscheidungen?, erzeugt 
aber Daten, die nachträglich durch weitere Beobachter für jedes Intervall über- 
prüft werden können (vgl. Tab. 6). Diese Datenstruktur bietet die Möglichkeit, 
Urteilsübereinstimmungen zwischen verschiedenen Beobachtern bis auf die 
Ebene der einzelnen Verhaltensindikatoren zu bestimmen. Auf diese Weise kön- 
nen Schwächen des Systems (z.B. wiederholte Differenzen in einem bestimmten 
Verhaltensindikator über verschiedene Beobachterpärchen und Unterrichts- 
stunden hinweg), aber auch Missverständnisse in der Beobachterschulung 
(erkennbar über wiederholte Differenzen bei einem Beobachter) identifiziert 
werden (vgl. Wirtz/Caspar 2002). 


Tab. 6: Time on Task-Werte von fünf Schülern einer ausgewählten Unterrichtsphase (aus 
Platzgründen ohne Werte der fünf Hilfsindikatoren) 


Int.-Anfang Int.-Ende S1 S2 S3 S4 S5 
00:16:58 00:17:58 1 1 1 1 1 
00:17:58 00:18:58 1 1 1 1 1 
00:18:58 00:19:58 1 1 1 1 1 
00:19:58 00:20:58 1 1 1 1 1 
00:20:58 00:21:58 1 1 1 Í 0 
00:21:58 00:22:58 1 I 1 1 1 
00:22:58 00:23:58 0 1 1 0 0 
00:23:58 00:24:58 1 1 1 1 1 
00:24:58 00:25:58 1 1 1 1 1 
00:25:58 00:26:58 1 1 1 1 1 
00:26:58 00:27:58 1 1 1 1 1 
00:27:58 00:28:58 0 1 1 0 1 
00:28:58 00:29:58 1 1 1 0 0 
00:29:58 00:30:58 1 1 1 1 0 
00:30:58 00:31:58 1 1 1 1 0 


Anm.: 0 = off; 1 = on; Zeitangaben im Format: hh:mm:ss 


8 Pro Minuten-Intervall und Schüler sind sechs Urteile zu fällen, d.h. beispielsweise bei 
20 Schülern und einer 30-minütigen Phase 3600 Kodier-Entscheidungen. 
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3. Beispiele für die Auswertung von Kodierungen 
mit dem Ziel der Datentriangulation 


Mit der dargestellten Datenbasis aus der oben erläuterten Kodierung der Time on 
Task lässt sich durch Aggregieren der Individualdaten auf Klassenniveau recht 
einfach ein Aktivitätsprofil über den Zeitverlauf erzeugen. Wir nennen das die 
„Reichweite der Lehrkraft“ im jeweiligen Intervall. Unser System ist in der vor- 
gestellten Form allerdings nur in Phasen des öffentlichen Unterrichts anwend- 
bar, denn in anderen Phasen wären die Verhaltensindikatoren nicht plausibel. 
In einer Gruppenarbeitsphase ist z.B. der Blickkontakt mit dem Hauptakteur in 
jeder Gruppe anders definiert. Deshalb filtern wir mithilfe der Kategorien der 
Sozialform nur solche Daten, die in Phasen des „Öffentlichen Unterrichts (ÖU)“ 
stattfinden’. Die Beobachtungsintervalle kann man grafisch vereinfacht als Zeit- 
linie (vgl. Abb. 2) visualisieren. 


Abb. 2: Time on Task-Verlauf auf Klassenebene in einer ausgewählten Unterrichtsphase 
(Anteil der Schüler mit On-Task-Status im jeweiligen Beobachtungsintervall) 
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Verlaufsabbildungen wie diese lassen sich ebenso für Untergruppen innerhalb 
der Klasse erzeugen (z.B. nach Geschlecht, fachlichem Leistungsstand etc.). Aus 
theoretischer Sicht ist dies besonders für Fragen der Binnendifferenzierung oder 
Adaptivität bedeutsam, da sich dadurch Differenzen im Beteiligungsverhalten 
zwischen den verschiedenen Personengruppen zu bestimmten Zeitpunkten 
und deren Bezug zu Unterschieden in der Unterrichtsführung der Lehrkraft 


9 Der durchschnittliche Anteil der Sozialform „ÖU“ an der Unterrichtszeit beträgt in 
unserer Stichprobe 60 % 
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untersuchen lassen. Ebenso kann durch Aggregieren der Intervallwerte das per- 
sonenspezifische On-Task-Niveau über die gesamte Stunde abgebildet werden 
(Tab. 7). 


Tab. 7: Personenspezifisches On-Task-Niveau über alle beurteilten Intervalle in einer Unter- 
richtsstunde (ausgewählte Schüler) 


Schüler-Nr. S1 S2 S3 S4 S5 S6 S7 S8 S9 


Anteil On-Task | 76% | 79% | 83% | 88% | 68% | 44% | 58% | 60% | 100% 


Der personenspezifische Stunden-Globalwert lässt sich wiederum auf Klassene- 
bene zusammenfassen und kann dazu dienen, eventuelle Unterschiede zwischen 
Stunden oder Lerngruppen aufzuzeigen (Tab. 8). 


Tab. 8: Durchschnittlicher Anteil an On-Task- Verhalten über alle Schüler in einer Klasse (in 
Prozent), über die Messzeitpunkte (Unterrichtsstunden) 


Klasse A Klasse B 
1. Std. 95 % 88 % 
2. Std. 95 % 90 % 
3. Std. 92 % 80 % 
4. Std. 90 % 69 % 
Durchschnitt 93% 83 % 


Auf dieser Ebene können, bei ausreichend großer Stichprobe, Unterschiede 
zwischen Lehrkräften oder Veränderungen in der Unterrichtsführung (z.B. im 
Rahmen von Interventionsstudien) in den Blick genommen werden. Zusätz- 
lich eröffnen sich Möglichkeiten zur Daten-Triangulation, sprich der Kom- 
bination unterschiedlicher Datenquellen zum Zwecke höherer theoretischer 
Aussagekraft (vgl. Denzin 1978, Flick 2011: 13), indem die Angaben in Bezie- 
hung gesetzt werden zu Daten, die nicht durch Beobachtung oder Auswertung 
der Videoaufnahmen, sondern losgelöst von der Unterrichtssituation gewon- 
nen werden, wie schriftliche Befragungen, Tests oder Interviews. Tab. 9 zeigt 
dazu beispielhaft Zusammenhänge der beobachteten Time on Task in Form 
der durchschnittlichen Rate über alle beobachteten Unterrichtsstunden auf 
Individualebene mit Testwerten aus einer schriftlichen Leistungsmessung und 
Hintergrunddaten der Personen, gewonnen in einer schriftlichen Befragung. 
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Tab. 9: Beziehungen der Variable Time on Task zu Befragungs-/Testdaten 


Mittelwertvergleiche (Testvariable: Time on Task) 
t-Test Effekt (d) 
Geschlecht (m/w) t(130) =-3.29,p<.0l 58 
Sprachhintergrund (deutsch/andere) t(130)= 0.72, p > .05 .16 
Zusammenhänge (mit Time on Task) 
Zusammenhang* 
Testleistung r=.12,p<.05 


*Produkt-Moment-Korrelation nach Pearson 


Daran schließen sich weitere Möglichkeiten an, verschiedene Datenquellen 
zusammengefasst zu veranschaulichen. Am genannten Beispiel geschieht dies 
mit einer Art „multiplem Sitzplan“, in dem die Beobachtungsdaten zum Ver- 
halten und Befragungsdaten mit Personeneigenschaften, ergänzt durch be- 
obachtungsbasierte Angaben über Wortmeldungen und Aufrufe, mit einem 
Sitzplan kombiniert werden (Abb. 3). Diese Darstellung kann zur Exploration 
der Datenlage und zur Hypothesengenerierung neuer Fragestellungen her- 
angezogen werden - etwa hinsichtlich der Sitzordnung bzw. der räumlichen 
Anordnung. 


Abb. 3: Sitzplan unter Einbezug von Test-, Personen- und Beobachtungsdaten 
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4. Zusammenfassung 


In diesem Beitrag wurde systematisches Beobachten unter Verwendung von 
audiovisuellen Aufzeichnungen als eine Variante sozialwissenschaftlicher Da- 
tenerhebung vorgestellt. Der Schwerpunkt lag dabei auf besonderen Vorteilen 
videobasierter Beobachtungsverfahren zur Erforschung des Gegenstands schuli- 
schen Unterrichts. Das zentrale Argument für die Verwendung dieser Methode 
besteht darin, dass die lange Zeit gängigen Feldbeobachtungen im Klassen- 
raum (in der Regel nicht-teilnehmend und offen) durch die hohe Komplexität 
des Geschehens an Grenzen gestoßen sind. In der Folge wurde oft auf Ratings 
zurückgegriffen, die allerdings nur schwach zwischen Beobachtung und Inter- 
pretation trennen. Videodaten bieten dagegen den Vorteil, dass sie die Anwen- 
dung komplexer Beobachtungssysteme erlauben. Im Weiteren wurden Vorzüge 
sowohl des wiederholten Zugriffs auf das Material als auch der Möglichkeit der 
Beteiligung mehrerer Forschungspersonen deutlich, zugleich aber auch damit 
verbundene methodische Erfordernisse, die in Form von Regeln oder Prinzipi- 
en zur Wahrung der Qualität im Forschungsprozess dienen (z.B. Auswahl der 
Beobachtungsstichprobe, Kategorienbildung, Beobachterübereinstimmung).'" 
Die Datenbeispiele haben gezeigt, dass durch diverse Arten der Erfassung und 
Protokollierung von Beobachtungsdaten (Ratings, Kodierung mit Ereignis- oder 
Zeitstichprobe, Kategoriensysteme) unterschiedliche Datenstrukturen geschaf- 
fen werden, die vielfältige Anknüpfungspunkte zur Verbindung mit alternati- 
ven Datenquellen oder auch der Auswertung auf verschiedenen Ebenen bieten. 
Diese Möglichkeiten erscheinen im Kontext des Begriffs der Triangulation als 
vielversprechend. Videobasierte Beobachtungsstudien entfalten ihr Potenzial al- 
lerdings für bestimmte Arten von Triangulation in besonderem Maße. Mit Blick 
auf die Unterscheidung von Denzin (1978) sind dabei zwei Formen hervorzuhe- 
ben. Erstens die Methodentriangulation, speziell die so genannte within-method 
triangulation (ebd.: 301), d.h. eine Variation des Skalierungsverfahrens oder Be- 
urteilungssystems innerhalb der Methode. Darunter können Maßnahmen zur 
Sicherung der Validität von Beurteilungsinstrumenten gefasst werden, wie etwa 
die Erprobung verschiedener Varianten von Ratingskalen in einem iterativen 
Prozess der Instrumentenkonstruktion (vgl. Seidel 2003b). Zweitens die Daten- 
Triangulation, also der Verbindung von Datenbeständen aus unterschiedlichen 
Erhebungsverfahren (Denzin 1978), der im Kontext der Videoforschung beson- 
ders relevanten Triangulationsform. Hierbei kommt der Vorteil zum Tragen, 


10 Es sei darauf hingewiesen, dass der Schwerpunkt in diesem Text auf quantitativen 
Zugängen zum Datenmaterial lag. Darüber hinaus verweisen wir auf Herrle et al. (2010). 
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dass durch audiovisuelle Aufzeichnungen Aspekte zugänglich gemacht werden, 
die durch ihre Flüchtigkeit auf andere Weise nur schwer zu erfassen sind (bei- 
spielsweise konkrete Verhaltensweisen einzelner Personen). Die auf diese Wei- 
se erfassten Merkmale lassen sich wie dargestellt gut mit alternativ erhobenen 
Merkmalen kombinieren, was wiederum die Einordnung in komplexere und 
umfassendere Rahmenmodelle von Unterricht erlaubt (vgl. Abschnitt 1). Fer- 
ner bieten sich durch Bearbeitung des Materials z.B. in Forschungsverbünden 
auch gewisse Spielräume zur Theorie-Triangulation an, also der Annäherung 
an den Gegenstand aus unterschiedlichen theoretischen Perspektiven und mit 
variierenden Hypothesen (Denzin 1978), etwa durch kontrastierende oder er- 
gänzende Beschreibungsansätze anhand von Interaktionstheorien, Theorien der 
pädagogischen Psychologie oder der Fremdsprachenforschung. Insgesamt sollte 
aber deutlich werden, dass videobasierte Beobachtungsstudien nicht nur Mög- 
lichkeiten zur Triangulation eröffnen, sondern sie in Gestalt der Verknüpfung 
und Kombination von Daten, der Variation von Instrumenten und der Beteili- 
gung mehrerer Forscher/innen regelrecht erfordern, um Beobachtungsdaten in 
ihrem Aussagegehalt aufwerten zu können. 

Die Umsetzung der hier dargestellten Verfahren würde ohne technische 
Hilfsmittel sehr schnell an Grenzen stoßen, sodass mittlerweile eine Reihe 
entsprechender Computerprogramme zur Analyse von Videodaten vorliegt. 
Durch differierende Schwerpunktsetzungen hinsichtlich Programmaufbau, 
Funktionen und interner Datenstruktur werden für die Nutzer jedoch jeweils 
unterschiedliche Analyse- und Auswertungsszenarien besonders begünstigt und 
andere teilweise eher erschwert. Sehr spezielle Kodiervorgänge wie beispielswei- 
se das vorgestellte Kategoriensystem zum Beteiligungsverhalten von Schülern 
im Unterricht, bei dem eine zeitstichprobenbasierte Beobachtung zu mehreren 
unterschiedlichen Verhaltenskomponenten auf verschiedene Personen gleich- 
zeitig angewendet wird, lassen sich nicht in allen Programmen gleichermaßen 
praktikabel umsetzen. Die erfolgreiche Implementierung von wissenschaftli- 
chen Instrumenten und Arbeitsweisen in eine digitale Arbeitsumgebung setzt 
daher eine bewusste Auswahl der geeigneten Analyse-Software voraus. 
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Videografie als Instrument zur 
Erforschung von Interaktionsprozessen 
im Elementarbereich 


Heidi Seifert 


Während im Bereich der empirischen Unterrichts- und Bildungsforschung 
ein allgemeiner Anstieg videobasierter Forschungsaktivitäten zu verzeichnen 
ist, wird die Videografie als Instrument zur Erforschung von Bildungsprozes- 
sen im Elementarbereich noch selten eingesetzt. Dies spiegelt sich auch in der 
überschaubaren Publikationslage zur methodischen Anlage von Videostudien 
im Elementarbereich wider. Der vorliegende Beitrag nimmt dies zum Anlass, 
um die Einsatzmöglichkeiten der Videografie im Forschungsfeld Kita darzu- 
stellen und unter verschiedenen Gesichtspunkten zu diskutieren. Am Beispiel 
einer Dissertationsstudie zu Erzieherin-Kind-Interaktionen in einer bilingualen 
Kita werden die einzelnen Phasen im videobasierten Forschungsprozess - von 
der Vorbereitung der Datenerhebung, die insbesondere die Beachtung daten- 
schutzrechtlicher Aspekte umfasst, über die Durchführung der videobasierten 
Datenerhebung bis hin zur Aufbereitung und Analyse der Videodaten - explizit 
aufgegriffen und methodische Überlegungen eingehend diskutiert. 


1. Einleitung 


Das Verfahren der Videografie konnte sich in den letzten Jahren in der empiri- 
schen Unterrichts- und Bildungsforschung zunehmend etablieren. Auch in der 
Fremdsprachendidaktik findet die videobasierte Beobachtung von Lehr- und 
Lernprozessen verstärkt Beachtung. Die Zunahme videogestützter Forschungs- 
aktivitäten ist in erster Linie auf technische Entwicklungen zurückzuführen, 
die gänzlich neue Perspektiven für die Videografie eröffneten. Während in den 
70er und 80er Jahren die Durchführung von Videostudien mit einem erheb- 
lichen Kosten- und Planungsaufwand verbunden war, ermöglichen technische 
Neuerungen heutzutage eine vergleichsweise komfortable Aufzeichnung, Ver- 
arbeitung und Analyse audiovisueller Daten und führten so zu „einem Quali- 
tätssprung der Videoaufzeichnung bei gleichzeitig sinkenden Kosten“ (Petko 
et al. 2003: 265). Moderne Camcorder zeichnen in hochauflösendem Digitalfor- 
mat auf und gewährleisten so ein hohes Maß an Bild- und Tonqualität. Zudem 
wurden Softwaretools entwickelt (z.B. Videograph, Interact, Catmovie, Atlas.ti), 
die eine deutlich verbesserte und komfortable Archivierung, Verarbeitung und 
Analyse selbst großer Datensätze ermöglichen. 
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Neben den technischen Entwicklungen, die zu einer zunehmenden Beliebt- 
heit der Videografie geführt haben, zeigt ein Vergleich mit der verwandten 
Methode der teilnehmenden Beobachtung, dass der Einsatz der Videografie - in 
Abhängigkeit von dem jeweiligen Forschungsgegenstand und dem individuel- 
len Erkenntnisinteresse - für einige Beobachtungsstudien einen forschungsme- 
thodischen Mehrwert bedeuten kann. Während die teilnehmende Beobachtung 
teilweise von den theoretischen Vorannahmen des Forschers eingefärbt sein 
kann, ermöglicht die videogestützte Beobachtung eine „relativ theorieunab- 
hängige und komplexitätserhaltende Dokumentation“ (Schramm/Aguado 2010: 
186), so dass Videodaten gegenüber Daten aus einer teilnehmenden Beobach- 
tung eine „weniger subjekt- und theoriegebundene Qualität“ (Petko et al. 2003: 
265) aufweisen können. Ein weiterer Vorteil gegenüber der teilnehmenden 
Beobachtung besteht darin, dass die Beobachtung iterativ durchführbar ist, d.h. 
dass die Beobachtung beliebig oft wiederholt werden kann (vgl. u.a. Knoblauch/ 
Schnettler 2007: 586). Dank der Reproduzierbarkeit der Beobachtung ist es 
fortan auch möglich, unterschiedliche Fragestellungen und Erkenntnisinteres- 
sen verschiedener Forscher/innen an einen einmal erhobenen Videodatensatz 
heranzutragen (vgl. Pauli/Reusser 2006: 791). 

Die Videografie kann demnach als Methode beschrieben werden, die die be- 
grenzte Wahrnehmungs- und Verarbeitungskapazität von Beobachter/innen im 
Forschungsfeld sowie die Flüchtigkeit des Geschehens überwinden kann. Die 
videobasierte Beobachtung gilt daher als Erhebungsinstrument, das der Komple- 
xität von Unterrichtsprozessen bzw. Lehr- und Lernprozessen am ehesten Rech- 
nung trägt (vgl. Schramm/Aguado 2010). Aufgrund ihrer dokumentierenden 
Funktion und Anschaulichkeit können Videodaten darüber hinaus für die Aus- 
und Weiterbildung von Lehrkräften nutzbar gemacht und als flexibles Medium 
zur Aneignung professionellen Wissens und professioneller Handlungsstrategi- 
en von Lehrkräften eingesetzt werden (zu verschiedenen Einsatzmöglichkeiten 
von Videos in der Lehrerbildung siehe Fischer/Schratz 2005). Videoaufzeich- 
nungen, die im wissenschaftlichen Kontext erhoben wurden, können beispiels- 
weise als Anschauungsmaterial zur Illustration von Forschungsergebnissen in 
der Lehrerbildung dienen und so eine „Brücke über die Kluft zwischen didakti- 
scher Theorie und Praxis“ (Petko et al. 2003: 278) schlagen sowie einen „Kristal- 
lisationspunkt der fachdidaktischen Verständigung“ (ebd.: 278) bilden. 

Parallel zum Anstieg videobasierter Forschungsaktivitäten im Bereich der 
empirischen Unterrichtsforschung fällt jedoch auf, dass Publikationen zum 
methodischen Design von Videostudien und zu Einsatzmöglichkeiten des Ver- 
fahrens der Videografie vorwiegend im mathematisch-naturwissenschaftlichen 
Bereich zu verorten sind (siehe z.B. Aufschnaiter/Welzel 2001, Hugener et al. 
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2006). In der (Fremd-)Sprachendidaktik scheinen Methodendiskussionen zur 
Durchführung von videogestützten Beobachtungsstudien bisher weniger etab- 
liert zu sein. Hinsichtlich der defizitären Publikationslage zur methodischen An- 
lage von Videostudien stellen so auch Ricart Brede et al. (2010: 259) resümierend 
fest: „Insgesamt stellt die explizite Beschreibung der Anlage und Durchführung 
von Videostudien im Bereich des Sprachunterrichts, zumindest des Deutschun- 
terrichts, ein Desiderat dar.“ Darüber hinaus spiegelt die Sichtung der Literatur 
zur Videografie wider, dass Videostudien bisher vorwiegend im Kontext schuli- 
scher Forschung zum Einsatz kommen. Für die videobasierte Erforschung von 
Lern- und Bildungsprozessen im Elementarbereich liegen zwar erste empirische 
Studien vor (z.B. König 2006, Ricart Brede 2011), jedoch scheint die Methode für 
diesen Bildungssektor bisher weniger Beachtung gefunden zu haben als in der 
empirischen Unterrichtsforschung. 

Anliegen des vorliegenden Beitrags ist es daher, die Genese einer Videostu- 
die im Elementarbereich offenzulegen und die methodischen Überlegungen, die 
bei der Entwicklung des Forschungsdesigns sowie der Planung und Durchfüh- 
rung der videobasierten Datenerhebung eingeflossen sind, zu diskutieren. Dies 
geschieht am Beispiel eines Dissertationsprojekts zum sprachlichen Interakti- 
onsverhalten von pädagogischen Fachkräften in einer bilingualen Kita. Der For- 
schungsgegenstand und die Ziele der Studie werden im Folgenden skizziert. 


2. Erkenntnisinteresse des Forschungsvorhabens 


Die europäische Sprachenpolitik setzt sich angesichts der zunehmenden Globa- 
lisierung und Internationalisierung des Arbeitsmarktes für die Förderung der 
individuellen Mehrsprachigkeit, den Erhalt und die Pflege der Sprachenvielfalt 
in Europa, sowie ein lebenslanges Fremdsprachenlernen ein (vgl. Europä- 
ische Kommission 1996). Insbesondere die Umsetzung der so genannten 
3-Sprachenformel (Erstsprache und zwei Fremdsprachen), die es jedem EU- 
Bürger ermöglichen soll, im Laufe seines Lebens Kompetenzen in mehreren 
Sprachen zu erwerben, ist ein erklärtes Ziel der europäisches Sprachenpolitik (vgl. 
ebd.). In den letzten Jahren fanden die sprachenpolitischen Empfehlungen durch 
die Einrichtung bilingualer Grundschulklassen und der Eröffnung bilingualer 
Kindergärten erste Umsetzungen. In Deutschland steigt vor allem die Nachfrage 
an bilingualen Kitas, so dass ihr Anteil allein seit 2007 um 25% angestiegen ist 
(vgl. FMKS 2010). Einrichtungen mit der Sprachenkombination Deutsch-Eng- 
lisch nehmen mit 42% eine dominante Stellung unter den bilingualen Vorschul- 
angeboten ein (vgl. ebd.). Viele dieser zweisprachigen Kindergärten arbeiten nach 
der Methode der Immersion, die aufgrund der Erkenntnisse der kanadischen 
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Immersionsforschung als eine der erfolgreichsten Methoden der Fremdspra- 
chenfrühvermittlung gilt (vgl. u.a. Genesee 1987, Wode 1995, Zydatiß 2000). Im 
Rahmen dieser Methode ist die zu erlernende Sprache nicht der Lerngegenstand 
wie im traditionellen Fremdsprachenunterricht, sondern die Arbeitssprache, die 
sämtliche Aktivitäten und den gesamten Tagesablauf in der Einrichtung beglei- 
tet. Die Sprachverwendung erfolgt innerhalb der Methode der Immersion nach 
der funktionalen Sprachentrennung gemäß dem Prinzip one person-one language 
(vgl. Döpke 1992). So interagieren beispielsweise in einer deutsch-englischen 
Kita die deutschsprachigen Fachkräfte ausschließlich auf Deutsch und die eng- 
lischsprachigen Fachkräfte ausschließlich auf Englisch mit den Kindern. 

Findet kindlicher Spracherwerb in einer bilingualen Kita in einem immersiven 
Kontext und gemäß der personengebundenen Sprachverwendung statt, kommt 
der sprachlichen Interaktion zwischen den Kindern und den pädagogischen 
Fachkräften eine wesentliche Bedeutung für den bilingualen Spracherwerb zu. 
Die Bedeutung der sozialen Lernumwelt für die Aneignung sprachlicher Kom- 
petenzen greifen sowohl interaktionistisch-kognitivistische als auch soziokultu- 
relle Erklärungsansätze zum Spracherwerb auf wie die Interaktionshypothese 
nach Long (1996) oder die „Zone der nächsten Entwicklung“ nach Wygotski 
(1987). Vor dem Hintergrund dieser interaktionistisch-kognitivistisch und so- 
ziokulturell geprägten Annahmen zum Spracherwerb kommt pädagogischen 
Fachkräften in Kitas eine tragende Rolle als Interaktions- und Kommunikations- 
partner zu, welche die sprachlichen Entwicklungschancen der betreuten Kinder 
durch ihr sprachliches Interaktionsverhalten entscheidend beeinflussen können. 

Trotz der steigenden Beliebtheit bilingualer Kitas sind die spezifischen Rah- 
menbedingungen, denen der kindliche Spracherwerb in jenen Einrichtungen 
unterliegt, nach wie vor weitestgehend unerforscht. Das Dissertationsprojekt 
knüpft an dieses Forschungsdesiderat an, indem es in der deutsch-englischen 
Kita der TU Darmstadt ausgehend von interaktionistischen und soziokulturel- 
len Erklärungsansätzen zum Spracherwerb Interaktionsprozesse zwischen pä- 
dagogischen Fachkräften und Kindern untersucht. In der Einrichtung, in der 
derzeit 40 Kinder von Bediensteten und Studierenden der TU Darmstadt betreut 
werden, wird die beschriebene Methode der Immersion und die personengebun- 
dene Sprachverwendung als Spracherziehungskonzept eingesetzt. Die leitende 
Frage des Dissertationsvorhabens ist, wie die deutsch- und englischsprachigen 
pädagogischen Fachkräfte im Kontext von Immersion und dem Prinzip one 
‚person-one language folgend sprachliche Interaktionen mit den ein- bis dreijäh- 
rigen Kindern gestalten und welche Charakteristika das sprachliche Verhalten in 
diesen Situationen aufweist. Diese übergeordnete Forschungsfrage wurde in die 
folgenden Teilfragen aufgeschlüsselt. 
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1. Welche Arten von Erzieherin-Kind-Kommunikationssituationen kommen 
während der Freispielzeit in der bilingualen Kita zustande? 

2. Welche Charakteristika weist das sprachliche Verhalten der Erzieherinnen 
auf und welche Formen sprachlicher Unterstützung leisten sie in den ver- 
schiedenen Interaktionssituationen? 


Mittels der ersten Teilfrage sollen Aktivitäten identifiziert werden, die rahmen- 
gebend und Voraussetzung für sprachliche Interaktionsprozesse zwischen päd- 
agogischen Fachkräften und Kindern sind. Darauf aufbauend sollen in einem 
zweiten Schritt mikroanalytisch einzelne Sequenzen näher in den Blick genom- 
men und das sprachliche Interaktionsverhalten der Erzieherinnen mit einem 
besonderen Fokus auf den Einsatz von Strategien des Scaffoldings und Aspekten 
der Responsivität analysiert werden. 

Die Ergebnisse der Studie werden dezidiert beschreiben, wie sprachliche 
Interaktionsprozesse zwischen pädagogischen Fachkräften und Kindern in der 
bilingualen Kita gestaltet sind. Zugleich sollen sie einen empirisch abgesicherten 
Einblick in die sprachliche Bildungsarbeit bilingualer Kitas liefern, der bislang 
in der Form noch nicht vorliegt. Damit können die Ergebnisse einen Beitrag zur 
Erforschung von Bedingungsfaktoren des kindlichen Spracherwerbs in bilin- 
gualen Kitas leisten. Darüber hinaus können die wissenschaftlichen Erkennt- 
nisse der Untersuchung auch eine Relevanz für die Praxis haben, indem sie als 
Ausgangsbasis für die Entwicklung von Weiterbildungs- und Qualifizierungs- 
maßnahmen für pädagogisches Personal in bilingualen Kitas dienen können. 
In diesem Zusammenhang können auch die Videodaten zur Veranschaulichung 
und Reflexion eingesetzt werden. 


3. Der Einsatz von Videografie in der vorliegenden Studie 


Ausgehend vom Forschungsgegenstand des Dissertationsprojekts soll in diesem 
Kapitel erörtert werden, warum die videobasierte Beobachtung eine geeigne- 
te Methode zur Bearbeitung der Forschungsfragen darstellt und wie sie in der 
vorliegenden Studie eingesetzt wird. Im Folgenden soll zunächst beschrieben 
werden, wie der Entscheidungsprozess für diese Methode in Verbindung mit 
der Generierung der Forschungsfragen gestaltet war. Darauf aufbauend sollen 
Punkte thematisiert werden, die bei der Vorbereitung einer videobasierten Da- 
tenerhebung im Elementarbereich zu beachten sind. Es werden zentrale Aspekte 
der Hauptdatenerhebung skizziert, bevor das Kapitel mit einem Ausblick auf das 
weitere geplante methodische Vorgehen, insbesondere bei der Datenauswertung, 
schließt. 
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3.1 Vorüberlegungen 


Vor der eigentlichen Datenerhebung wurde das Forschungsfeld mehrere Mona- 
te mittels teilnehmender Beobachtung erkundet. Durch die regelmäßigen, d.h. 
an zwei Vormittagen pro Woche stattfindenden Beobachtungen konnte ein ers- 
ter Feldzugang geschaffen und ein Vertrauensverhältnis zu den pädagogischen 
Fachkräften und der Kita-Leitung, aber auch zu den Kindern und deren Eltern 
aufgebaut werden. Die teilnehmende Beobachtung ermöglichte zudem wertvolle 
erste Einblicke in den Kita-Alltag mitsamt seiner Routinen, die Außenstehenden 
in dieser Form nicht zugänglich wären (vgl. Bortz/Döring 2006: 267). 

Die Erkundung des Forschungsfeldes kann in diesem Forschungsvorhaben als 
Prozess verstanden werden, der sich in seinen Grundzügen an den „klassischen“ 
Phasen einer teilnehmenden Beobachtung orientiert, die von Spradley (1980, 
zitiert nach Flick 2004: 207) beschrieben wurden. Diese Phasen sind gekenn- 
zeichnet durch eine zunehmende Konkretisierung und Konzentration auf einen 
speziellen Forschungsgegenstand (vgl. Flick 2004: 207). Die teilnehmende Be- 
obachtung erfolgte dabei zunächst als „deskriptive“ (ebd.) oder auch als „freie“, 
„offene“, „unstandardisierte“ (Bortz/Döring 2006: 269) Beobachtung. Es sollten 
in einem ersten Schritt, einem qualitativ-explorativ orientierten Forschungsde- 
sign Rechnung tragend, unvoreingenommen alle Aspekte in die Beobachtung 
einbezogen werden, um dadurch die Komplexität des Forschungsfeldes mög- 
lichst differenziert erfassen zu können. Die Eindrücke aus der teilnehmenden 
Beobachtung sowie umfassende Ereignisabläufe und interessant erscheinende 
Einzelheiten wurden nach jedem Kita-Besuch in einem Forschungstagebuch 
festgehalten. Parallel zur teilnehmenden Beobachtung und der Verschriftlichung 
der Beobachtungsergebnisse im Forschungstagebuch wurde die Forschungslite- 
ratur gesichtet und mit den Eindrücken aus dem Kita-Alltag abgeglichen. Durch 
diesen zyklischen Prozess verengte und verdichtete sich der Beobachtungsfokus 
zunehmend zu einer „fokussierten Beobachtung“ (Spradley 1980, zitiert nach 
Flick 2004: 207) der sprachlichen Interaktionsprozesse zwischen den pädagogi- 
schen Fachkräften und den Kindern während der Freispielzeit. Das endgültige 
Forschungsinteresse wurde schließlich in den oben genannten Forschungsfragen 
konkretisiert und in mehrere Teilfragen gegliedert. Die teilnehmende Beobach- 
tung fand in der Folgezeit zunehmend „selektiver“ statt (ebd.) und konzentrierte 
sich größtenteils auf Beobachtungssituationen, die für die formulierte Fragestel- 
lung relevant waren. 

Im Zuge der Generierung der Forschungsfragen und der Verdichtung des Be- 
obachtungsfokus auf die sprachlichen Interaktionsprozesse zwischen Erzieherin- 
nen und Kindern erfolgten zudem wichtige Vorüberlegungen zum Einsatz der 
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Videografie als Datenerhebungsinstrument in der vorliegenden Studie. Zwar 
fungierte die teilnehmende Beobachtung in der Kita als wichtiger Schlüssel, um 
einen ersten Feldzugang zum Forschungsfeld und den Akteuren herzustellen 
und um direkt aus dem Feld die Forschungsfragen zu entwickeln, doch erwies 
sich die Methode als unzulänglich, um einen angemessenen Datenkorpus für die 
Dissertationsstudie zu erstellen. Aufgrund der Komplexität und Vielschichtig- 
keit des Forschungsgegenstandes - sprachliche Interaktionen enthalten sowohl 
verbale, paraverbale und nonverbale Elemente - stellte es sich äußerst schwierig 
dar, diese Fülle an Informationen zu protokollieren. Zudem konnte meistens erst 
im Anschluss an die Beobachtung und nicht direkt in der Situation protokolliert 
werden. Da Erinnerungen an konkrete Situationen jedoch nur zeitlich begrenzt 
abrufbar sind, waren die Protokolle oft lückenhaft und anfällig für Beobach- 
tungsfehler und subjektive Verzerrungen. In Verbindung mit der Flüchtigkeit 
und mangelnden Konservierbarkeit der Daten aus der teilnehmenden Beobach- 
tung wurde es zudem als zunehmend unbefriedigend empfunden, dass die Da- 
ten in ihrer Authentizität und Informationsfülle nicht unmittelbar mit anderen 
Forscher/innen zu Zwecken der kommunikativen Validierung geteilt werden 
konnten. Diese anhand der Beobachtungsprotokolle vorzunehmen, muss als äu- 
Berst schwierig erachtet werden, da die Daten an sich bereits subjekt- und the- 
oriegeleiteten Interpretationen durch die beobachtende Person unterliegen. Die 
genannten Schwächen der teilnehmenden Beobachtung, wie die Komplexität der 
Daten, deren begrenzte Dokumentierbarkeit und die Flüchtigkeit der Beobach- 
tung, waren in Kombination mit den eingangs erwähnten Vorzügen der videoba- 
sierten Beobachtung die Hauptargumente für den Einsatz der Videografie als 
Datenerhebungsinstrument. 

Mit der Entscheidung für den Einsatz der Videografie sind vor der eigent- 
lichen Datenerhebung wichtige Vorbereitungen zu treffen. Zum einen müssen 
die Akteure im Feld ihre Zustimmung zur Teilnahme an der Videostudie geben. 
Zum anderen ist ein geeignetes Aufnahmekonzept, das eine Standardisierung 
der Aufnahmesituation ermöglicht, zu entwickeln und zu pilotieren. Wie diese 
beiden Schritte in der beschriebenen Dissertationsstudie bewältigt wurden, soll 
im Folgenden dargelegt werden. 


Datenschutz 

Bei Videodaten handelt es sich um äußerst sensible Daten. Anders als bei Au- 
dioaufnahmen oder Interviews ist eine komplette Anonymisierung der Daten 
nur unter großem technischen Aufwand möglich, was gleichzeitig mit einem 
erheblichen Authentizitätsverlust und einer Einschränkung der Aussagekraft 
des Datenmaterials einhergeht (vgl. Petko et al. 2003: 269). Insbesondere bei 


88 Heidi Seifert 


Analysen, bei denen die Mimik der beobachteten Personen einbezogen werden 
soll, ist eine Anonymisierung der Daten problematisch. Dieser Umstand erfor- 
dert einen äußerst sensiblen und verantwortungsvollen Umgang mit dem erho- 
benen Videomaterial sowie den Richtlinien des Datenschutzes. Sollen Personen 
zu wissenschaftlichen Zwecken gefilmt werden, müssen alle an der Videostudie 
Beteiligten in schriftlicher Form ihr ausdrückliches Einverständnis dafür ertei- 
len. Die rechtliche Grundlage für dieses Vorgehen findet sich im allgemeinen 
Persönlichkeitsrecht (APR) und ist im Grundgesetz rechtlich verankert (vgl. 
Bundeszentrale für politische Bildung 1998: 13). 

Diese Einverständniserklärung, auch informed consent form (Mackey/Gass 
2005: 26)!, sollte einführende Informationen zur Durchführung und zum Ziel 
der Studie enthalten und transparent machen, wie die Daten bearbeitet, archi- 
viert und anonymisiert werden. Darüber hinaus sollte eine Kontaktadresse für 
Rückfragen und im Falle von Dissertationsstudien auch die betreuenden Pro- 
fessoren bzw. Professorinnen genannt werden. Die angefragten Personen sollten 
in einem letzten Schritt der Erklärung unterzeichnen, dass sie a) über die Studie 
aufgeklärt worden sind b) damit einverstanden sind, dass von ihnen/ ihrem Kind 
Videoaufnahmen angefertigt werden und c) dass diese Daten zu wissenschaftli- 
chen Zwecken verwendet werden dürfen. 

In der vorliegenden Studie ist es durch den kontinuierlichen und intensiven 
Kontakt zum Forschungsfeld gelungen, eine hohe Kooperationsbereitschaft von 
Seiten der pädagogischen Fachkräfte und der Eltern (stellvertretend für ihre 
Kinder) zu erzielen’. Dazu trug auch ein möglichst hohes Maß an Transparenz 
bei, da bei Elternabenden, Themenabenden und in persönlichen Gesprächen 
mit den Erzieherinnen und Eltern offene Fragen geklärt und Zweifel größten- 
teils beseitigt werden konnten’. Dass diese hohe Teilnahmebereitschaft keine 


1 Mackey/Gass (2005) diskutieren ausführlich die ethischen Gesichtspunkte, die im 
Vorfeld und während einer empirischen Studie mit Zweitsprachenlernenden bedacht 
werden sollten. In diesem Zusammenhang geben sie auch hilfreiche und praxisnahe 
Informationen zur Erstellung von Einverständniserklärungen und liefern Beispiele 
für den Aufbau derartiger Dokumente (ebd.: 33), die als Orientierungshilfe dienen 
können. 

2 Die Kinder, für die keine von den Eltern unterschriebene Einverständniserklärung 
zur Teilnahme an der Videostudie vorlag, wurden an den Tagen der Videoaufzeich- 
nungen in einer anderen Kita-Gruppe betreut. 

3 Da die bilinguale Kita der TU Darmstadt von vielen Kindern mit Eltern nicht- 
deutscher Erstsprache besucht wird, wurden die Einverständniserklärungen in An- 
lehnung an die Vorschläge für die Erstellung von Einverständniserklärungen für 
nichterstsprachliche Proband/innen (vgl. Mackey/Gass 2005: 32) neben Deutsch 
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Selbstverständlichkeit ist, zeigen Angaben anderer videobasierter Studien wie 
der DESI-Studie, bei der lediglich 50% der angefragten Lehrkräfte bereit waren, 
ihren Unterricht videografieren zu lassen (vgl. u.a. Göbel 2010: 300). Die Teil- 
nahmebereitschaft an Videostudien wird daher auch immer von der Gesamtgrö- 
ße der Stichprobe beeinflusst. So war es in der beschriebenen Dissertationsstudie 
aufgrund der Stichprobengröße möglich, im Vorfeld einen persönlichen Kon- 
takt zu allen potentiellen Teilnehmenden der Studie herzustellen, was sich ver- 
mutlich positiv auf die Teilnahmebereitschaft ausgewirkt hat. Dies ist jedoch bei 
Studien mit einer größeren Stichprobe oft nicht möglich. 

Neben dem schriftlichen Einverständnis der pädagogischen Fachkräfte und 
der Eltern wurde auch die schriftliche Einwilligung des Trägers der Einrichtung 
eingeholt, Videoaufzeichnungen in den Räumlichkeiten der Kita anfertigen 
und diese zu wissenschaftlichen Zwecken nutzen zu dürfen. Wie in der TIMSS- 
Videostudie (vgl. Petko et al. 2003: 270) so unterzeichnete auch die wissenschaft- 
liche Hilfskraft, die an der Datenerhebung und Aufbereitung der Daten beteiligt 
war, eine Vertraulichkeitsvereinbarung, in der sie sich verpflichtete, keinerlei 
personenbezogenen Informationen aus den Daten an Dritte weiterzugeben. 

Es sei abschließend nochmals darauf hingewiesen, dass in Deutschland nach 
wie vor eine größtenteils ablehnende oder zumindest skeptische Haltung bezüg- 
lich der Teilnahme an Videostudien zu beobachten ist (vgl. Göbel 2010: 300). 
Gerade deshalb nimmt der Schritt der Anfrage bei den zu beobachtenden Per- 
sonen und die Aufklärung über die Ziele und das Vorgehen der Studie in Form 
einer informed consent form eine Schlüsselposition in Videostudien ein. 


Entwicklung eines geeigneten Aufnahmekonzepts 

Im Rahmen wissenschaftlicher Analysen sollten Videodaten nach einem eigens 
entwickelten Aufnahmekonzept erhobenen werden, das eine Standardisierung 
und somit auch eine Qualitätssicherung und Vergleichbarkeit der Daten ermög- 
licht. Das Aufnahme- oder auch Kamerakonzept sollte dabei den spezifischen 
Charakteristika des Forschungsfeldes Rechnung tragen und relevante Daten zur 
Beantwortung der Forschungsfragen liefern. Für die großen Schulleistungsstudien 
wurden einige Aufnahmekonzepte erarbeitet und auch publiziert (siehe z.B. Petko 
2006: 15-38). Wie bereits angedeutet, liegen für die Videografie von Bildungs- 
prozessen im Elementarbereich wesentlich weniger und spärlicher methodische 


auch auf Englisch ausgehändigt. Durch zusätzliche mündliche Rückfragen an die El- 
tern wurde sichergestellt, dass mindestens eines der beiden Elternteile den Inhalt der 
deutschen oder englischen Einverständniserklärung versteht und so eine informierte 
Einwilligung zum Filmen des eigenen Kindes geben kann. 
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Überlegungen vor (vgl. Ricart Brede 2011: 97). Bei der Entwicklung eines Aufnah- 
mekonzepts für den Elementarbereich ist zu bedenken, dass schulische Lernset- 
tings und der Kita-Alltag grundsätzlich verschieden sind. Während die beteiligten 
Akteure im Unterrichtsgeschehen zumeist feste Sitzplätze haben, ist die Kinder- 
gartenpraxis durch ein hohes Maß an Bewegungsaktivitäten charakterisiert. Zu- 
dem finden im Kindergarten viele Aktivitäten in einem Raum parallel statt, anstatt, 
wie im klassischen Unterrichtsgeschehen, auf die Person der Lehrkraft fokussiert 
zu sein. Eine nicht zu unterschätzende Herausforderung stellen des Weiteren die 
enorme Geräuschkulisse und der Lärmpegel in einer Kita dar. Insgesamt ist die 
Aufnahmesituation im Elementarbereich daher im Vergleich zur schulischen Un- 
terrichtsbeobachtung als unübersichtlicher und komplexer zu charakterisieren. 

In der vorliegenden Studie wurde die Aufnahmesituation Anfang 2012 pi- 
lotiert. In diesem Rahmen wurden an fünf Filmtagen verschiedene Kamera- 
positionierungen und Kameraeinsatzszenarien in einer der vier Kita-Gruppen 
erprobt. Die Vorüberlegungen zum Kameraeinsatz basieren dabei auf den Ka- 
meramanualen bestehender Videostudien im Elementarbereich (z.B. König 
2006, Ricart Brede 2011) und beziehen sich im weiteren Sinne auch auf schuli- 
sche Videostudien wie TIMSS und DESI. Mittels der Pilotierungsphase sollten 
in Vorbereitung auf die Hauptdatenerhebung insbesondere die Positionierung 
und Ausrichtung der Kamera(s) in den Kita-Gruppenräumen sowie die Bedie- 
nung der Kamera(s) getestet werden. Darüber hinaus sollten auch die Reaktion 
der beobachteten Personen auf die Kamerapräsenz und die Kameraeffekte in die 
Erarbeitung eines geeigneten Aufnahmekonzepts einfließen. Zudem wurde im 
Rahmen der Pilotierung der Frage nachgegangen, wie ein angemessenes Verhal- 
ten der Filmpersonen bei der Bedienung hinter der Kamera aussehen sollte, um 
das zu beobachtende Geschehen so wenig wie möglich zu beeinflussen. 

Dieser Phase kommt im Forschungsprozess einer Videostudie eine tragende 
Rolle zu. Da die vorliegende Dissertationsstudie den Anspruch erhebt, natürli- 
che und authentische Daten aus dem Alltag der bilingualen Kita zu erheben, die 
möglichst unbeeinflusst durch den Forscher zustande kommen (vgl. Silverman 
2005), sollten die Aufzeichnungen ein Verhalten widerspiegeln, dass die Beob- 
achteten auch ohne die Kameraanwesenheit zeigen würden. Gleichzeitig handelt 
es sich bei den videobasierten Beobachtungen dieser Studie um offene Beobach- 
tungen, d.h. die Beobachteten wussten zu jedem Zeitpunkt der Aufnahme, dass 
sie aufgenommen werden. Allein dieses Wissen um die Anwesenheit der Kame- 
ra und die Aufnahmesituation kann allerdings auf Seiten der Beobachteten zu 
Verhaltensänderungen führen, die durch die Beobachtungssituation hervorge- 
rufen werden. Dieses Phänomen wird in der Methodenliteratur zur Videografie 
als „Invasivität“ (Petko et al. 2003: 270) und zum Teil auch als „Reaktivität“ oder 
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„Reaktanz“ (Knoblauch/Schnettler 2007: 588) bezeichnet. Das Aufnahmekon- 
zept dieser Studie sollte daher so geartet sein, dass mögliche Effekte der Erhe- 
bungssituation berücksichtigt und nach Möglichkeit Strategien zur Vermeidung 
von Invasivität eingesetzt werden. 

Die Pilotierung hat zusammengefasst gezeigt, dass ein zurückhaltendes 
Verhalten seitens der Filmpersonen angebracht ist, um möglichst wenig Auf- 
merksamkeit auf die Erhebungssituation zu lenken. In Anlehnung an bereits be- 
stehende Videostudien erwies es sich auch für dieses Vorhaben als vorteilhaft, 
sich als Filmperson vornehmlich auf die Bedienung der Kameraausrüstung zu 
konzentrieren und Interaktionen mit den Beobachteten und dem Forschungsfeld 
zu vermeiden (vgl. Petko et al. 2003: 270). Unterstützt werden sollte dies durch 
unauffällige und für Kinder uninteressante Kleidung, d.h. es sollte auf auffäl- 
lige Farben und Geräusche durch Schmuck verzichtet werden. Zudem fanden 
die Aufnahmen in dem alltäglichen Gruppenraum der Kita statt, so dass sich 
sowohl die Kinder als auch die Erzieherinnen in ihrer gewohnten und vertrau- 
ten Umgebung befanden. Darüber hinaus erhielten die Erzieherinnen vor den 
Aufnahmen ein Schreiben zur Vorbereitung, in dem sie gebeten wurden, sich 
während der Aufnahmesituation möglichst normal zu verhalten und explizit ge- 
macht wurde, dass an den Filmtagen keine speziell vorbereiteten und geplanten 
Aktivitäten stattfinden müssen. Um die Kinder besser auf die Aufnahmesituation 
vorzubereiten, wurden die Kameras bereits einige Tage vor der Pilotierung im 
Gruppenraum aufgestellt, so dass sich die Kinder an die Ausrüstung (Kamera, 
Stativ) gewöhnen konnten. 

Um die Invasivität der Kamerapräsenz auf das Verhalten der Beobachteten ab- 
schätzen zu können, wurde im Anschluss an die Aufzeichnungen in der Pilotie- 
rung ein Reflexionsgespräch mit den pädagogischen Fachkräften geführt, in dem 
sie äußern durften, inwieweit sie sich von dem an diesem Tag erprobten Kame- 
rakonzept „gestört“ und „beobachtet“ gefühlt haben. Da die Erzieherinnen die 
Kinder zudem besser kennen, konnten sie auch Auskunft darüber geben, wie die 
Aufnahmesituation das Verhalten der Kinder beeinflusst hat. Auf Grundlage die- 
ser Rückmeldungen wurden die Aufnahmebedingungen stetig weiterentwickelt 
und die zu beobachtenden Personen in den Forschungsprozess und die Gestal- 
tung der Aufnahmebedingungen aktiv mit einbezogen. Dies geschah unter der 
Annahme, dass die Personen nur dann ein natürliches Verhalten zeigen werden, 
wenn sie sich in der Aufnahmesituation nicht gestört, sondern wohl fühlen. Das 
Aufnahmekonzept, das schließlich der Hauptdatenerhebung zugrunde gelegt 
wurde, ist daher das Resultat eines gemeinsamen Entwicklungsprozesses, an dem 
sowohl die hauptverantwortliche Doktorandin und wissenschaftliche Hilfskraft 
als auch die Beobachteten, in diesem Fall die Erzieherinnen, beteiligt waren. 
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Die Erkenntnisse aus der Pilotierung und das entwickelte Aufnahmekonzept 
wurden schließlich in einem Kameraskript zusammengefasst. Dieses stellt im 
Rahmen von Videostudien ein wichtiges Instrument zur Standardisierung und 
Qualitätssicherung dar (vgl. Hall 2000). Durch das Aufstellen von Richtlinien 
zur Erhebungssituation (Position/Ausrichtung der Kameras, Bedienung der 
Kameras, Verhalten der Filmpersonen) ist es möglich, Videoaufnahmen unter- 
einander vergleichbar zu machen (vgl. Petko 2006: 15). Mithilfe dieser ausführ- 
lichen Anleitung, die als Kameramanual oder Kameraskript bezeichnet wird, 
kann somit gewährleistet werden, dass die Erhebungsbedingungen an den ver- 
schiedenen Aufnahmetagen in der bilingualen Kita vergleichbar sind. 


3.2 Datenerhebung 


Nach der Pilotierung der Aufnahmebedingungen und einer erneuten Feinab- 
stimmung der Erhebungsinstrumente fand die Hauptdatenerhebung in der 
bilingualen Kita der TU Darmstadt von Oktober bis Dezember 2012 statt. In die- 
sem Zeitraum wurden alle vier Gruppen der Einrichtung an jeweils fünf Tagen 
videografiert. Es entstand somit ein Datenkorpus von über zwanzig Stunden 
Videomaterial. Während der Durchführung der videobasierten Datenerhebung 
zeigte sich, dass die Vorerfahrungen aus der Pilotierung insbesondere mit der 
Handhabung des Equipments eine unerlässliche Vorarbeit darstellten. So war 
die Aufgabenverteilung zwischen den durchführenden Personen (die hauptver- 
antwortliche Doktorandin, die die Kamerabedienung übernahm und die wis- 
senschaftliche Hilfskraft, die für die Überprüfung der Funktionstüchtigkeit vor 
jedem Aufnahmetag und den Aufbau der Kameraausrüstung in der Kita verant- 
wortlich war) zu Beginn der Datenerhebung schon aufeinander abgestimmt und 
alle technischen Fragen im Rahmen der Pilotierung geklärt. In seinen Grund- 
zügen konnten die im Kameraskript formulierten Richtlinien daher umgesetzt 
werden. Allerdings bringt es der Kita-Alltag mit sich, dass trotz sorgfältiger Vor- 
bereitung nicht alle Vorkommnisse vorher planbar sind. Beispielsweise machten 
es Krankheitsfälle seitens der pädagogischen Fachkräfte oder die Eingewöh- 
nungsphase von neuen Kindern in die Kita nötig, von den zuvor festgelegten 
Richtlinien abzuweichen, bzw. diese an den betreffenden Filmtagen flexibler zu 
handhaben und zu modifizieren. In diesem Zusammenhang weisen auch Petko 
et al. (2003: 271) darauf hin, dass eine restlose Standardisierung aufgrund unvor- 
hersehbarer Zwischenfälle nicht möglich ist und das Kameraskript somit immer 
„einen Balanceakt zwischen Standardisierung und Offenheit“ darstellt. Um die 
Umsetzbarkeit und eventuelle Abweichungen vom Kameramanual zu dokumen- 
tieren, wurde begleitend zu den Filmtagen ein Aufnahmeprotokoll geführt, in 
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dem Aspekte der Umsetzbarkeit des Aufnahmekonzepts und auch Zwischenfälle 
bzw. Besonderheiten während der Aufnahmen protokolliert wurden. In Bezug 
auf die bereits genannten Invasivitätseffekte wurde auf einen anschließenden 
Fragebogen zur Typikalität der Aufzeichnungen, wie er in der TIMSS-Studie 
zum Einsatz gekommen ist (vgl. Petko et al. 2003: 270), bewusst verzichtet. 
Durch den intensiven Feldkontakt vor der Datenerhebung war es auch ohne 
nachträgliche Befragung möglich, die Typikalität der Videoaufzeichnungen ein- 
zuschätzen. Insgesamt kann wohl Petko et al. (vgl. 2003: 270) zugestimmt wer- 
den, wenn sie sagen, dass (Lehr-)Personen zwar tendenziell versuchen, einen aus 
ihrer Sicht von ihnen erwünschtes oder gutes Verhalten zu zeigen, doch muss 
auch angenommen werden, dass eine spontane und gleichzeitig grundlegende 
Verhaltensänderung aufgrund der Aufnahmesituation nicht ohne weiteres mög- 
lich sein wird (siehe z.B. auch Wahl 1991). 

Nach Abschluss der Datenerhebung stellt die Aufbereitung und Auswertung 
der Videodaten den nächsten Arbeitsschritt dar. Im Folgenden soll daher ein 
Ausblick auf das geplante Vorgehen gegeben werden. 


3.3 Ausblick auf Aufbereitung und Auswertung der Videodaten 


Parallel zur Datenerhebung wurde mit der Aufbereitung der Videodaten begon- 
nen. Diese umfasst die doppelte Speicherung der Daten an zwei verschiedenen 
Orten, um die Gefahr eines Datenverlusts zu verringern. Das Videomaterial, das 
in Full-HD-Qualität aufgenommen wurde, wurde in ein stark komprimiertes 
MPEG2-Format umgewandelt.‘ Die Komprimierung des Datenmaterials ver- 
folgte dabei zwei Ziele. Zum einen sollte die zu speichernde Datenmenge re- 
duziert werden (das MPEG2-Format ist weniger hochauflösend und benötigt 
daher weniger Speicherplatz). Zum anderen sollte es in ein Format umgewandelt 
werden, das von gängigen computerbasierten Analysetools unterstützt wird, da 
diese Analysesoftwares z.T. erhebliche Probleme mit zu großen Datenmengen 
haben. Das Ausgangsmaterial in Full-HD-Qualität steht jedoch nach wie vor 
zur Verfügung und kann beispielweise zu Präsentationszwecken zum Einsatz 
kommen. Zur Anonymisierung der Daten wurden den videografierten päda- 
gogischen Fachkräften und den einzelnen Filmtagen Codes zugeordnet, die für 
Außenstehende eine Zuordnung zu Personen unmöglich machen. 

Die Analyse der Videodaten soll in zwei aufeinander aufbauenden Schritten 
erfolgen. In einem ersten Schritt soll das Material makroanalytisch, d.h. auf der 
Ebene des gesamten videografierten Kita-Vormittags erfolgen, um in einem 


4 Die Bearbeitung der Videodaten erfolgte mithilfe der Software Pinnacle Studio 14. 
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zweiten Schritt mikroanalytisch einzelne Sequenzen zu fokussieren. Dies ist ein 
gängiges Verfahren videogestützter Forschung und ein Forschungsdesign, das 
auch vielen bekannten Videostudien, wie beispielweise der DESI-Studie zugrun- 
de liegt (vgl. Helmke et al. 2007: 38). Aufgrund der sequenziellen, aber auch 
logisch-inhaltlichen Verknüpfung dieser beiden Teilanalysen spricht man auch 
von einem sequential mixed-method-Stichprobengenerierungsverfahren (Tedd- 
lie/Yu 2007: 77), beidem sowohl quantitative als auch qualitative Analyseverfah- 
ren zum Einsatz kommen. Die Annäherung an den Analysegegenstand mithilfe 
einer Kombination zweier oder mehrerer Methoden wird als mixed methods ap- 
proach (vgl. Jick 1979) oder als Methoden-Triangulation bzw. methodologische 
Triangulation bezeichnet (siehe die Klassifikation nach Denzin (1970/1989), so- 
wie die zusammenfassende Klassifikation im Einleitungsbeitrag von Settinieri in 
diesem Band). Der Einsatz mehrerer Methoden verfolgt dabeinicht das Ziel einer 
„einseitigen oder wechselseitigen Validierung der Einzelergebnisse“ (Flick 2011: 
19), sondern die eingesetzte Methodenvielfalt soll gemäß einer neueren Vorstel- 
lung von Triangulation zu einer umfassenden Gegenstandsabbildung beitragen 
(vgl. Flick 2011: 18). Vor allem, da es sich bei sprachlichen Interaktionsprozessen 
um einen äußerst komplexen Forschungsgegenstand handelt (vgl. Abschnitt 2 
dieses Beitrags), bietet sich eine Kombination mehrerer Methoden im Analyse- 
prozess an. Das Vorgehen der einzelnen Analyseschritte und die Kombination 
der Methoden im Sinne der Triangulation sollen im Folgenden erläutert werden. 


Analyseschritte 

In Vorbereitung auf die erste Teilanalyse sollen die Videodaten zunächst auf- 
bereitet und in überschaubare Einheiten eingeteilt werden, welche die spätere 
Analyseeinheit bilden. Grundsätzlich stehen zur so genannten Sequenzierung, 
d.h. für die Einteilung des Materials in einzelne Sequenzen, zwei Verfahren zur 
Verfügung: das time-sampling oder das event-sampling (vgl. Bakeman/Gottman 
1994). Beim time-sampling wird das gesamte Material in gleich lange Zeitinter- 
valle, z.B. in Abschnitte von jeweils 30 Sekunden, unterteilt. Beim event-samp- 
ling hingegen erfolgt die Sequenzierung ereignisbezogen, d.h. immer wenn eine 
neue Aktivität einsetzt, wird ein Sequenzwechsel kodiert. So entstehen durch die 
inhaltsbezogene Segmentierung? Handlungsphasen und Videoabschnitte unter- 
schiedlicher Länge (vgl. Petko et al. 2003: 274). Das event-sampling ist ein durch- 
aus übliches Verfahren der videogestützten Forschung, das auch in anderen 


5 Dinkelaker/Herrle (2009: 52) bezeichnen dieses Vorgehen daher auch als 
Segmentierungsanalyse. 
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Studien zum Einsatz gekommen ist (vgl. z.B. Hugener et al. 2006: 48). Auf der 
Grundlage dieser Sequenzierung soll dann im Rahmen der ersten Teilanalyse 
eine Basiskodierung mithilfe eines niedrig-inferenten Beobachtungsinstruments 
vorgenommen werden. Bei niedrig-inferenten Beobachtungsinstrumenten han- 
delt es sich um Kategorien, die direkt beobachtbar sind, d.h. auf Sichtstrukturen 
beruhen, während hoch-inferente Beobachtungsinstrumente ein höheres Maß 
an interpretativen Schlussfolgerungen (Inferenzen) erfordern (vgl. Clausen et al. 
2003, Seidel et al. 2003). Mithilfe der niedrig-inferenten Basiskodierung soll da- 
her eine möglichst präzise Beschreibung der inhaltlichen Nutzung der Freispiel- 
zeit, d.h. der Gestaltung, der Ereignisse und Organisationsformen vorgenommen 
werden. Als Ziel und Ergebnis dieses Schritts steht daher die Identifizierung von 
Handlungssequenzen und inhaltlichen Gestaltungsmerkmalen, die die rahmen- 
gebenden Aktivitäten für das Zustandekommen von sprachlichen Interaktionen 
zwischen pädagogischen Fachkräften und Kindern während der Freispielzeit in 
der bilingualen Kita (vgl. erste Teilfrage der Forschungsfrage) bilden. 

Die Diskussion der Methode der teilnehmenden Beobachtung hat bereits ge- 
zeigt, dass Beobachtungen anfällig für subjektive Einflüsse durch den Beobach- 
ter sind und durch theorie- und vorwissensgeleitete Interpretationen eingefärbt 
sein können. Um „Verzerrungen durch die Person des Forschers aufzudecken 
bzw. zu minimieren“ (Flick 2011: 14) und zu prüfen, ob die entwickelten Be- 
obachtungsinstrumente transparent und intersubjektiv nachvollziehbar sind, 
wird die Basiskodierung für einen Teil des Datensatzes durch zwei verschiede- 
ne Beobachter/innen vorgenommen. Der Einsatz von zwei Beobachter/innen 
wird in Anlehnung an die Klassifikation von Triangulations-Typen nach Denzin 
(1970/1989) als Investigator Triangulation oder auch Beobachtertriangulation 
bezeichnet (Denzin 1970/1989, zitiert nach Flick 2011: 12f.). 

Auf Grundlage der eher quantitativ angelegten niedrig-inferenten Basiskodie- 
rung sollen im zweiten Analyseschritt aus dem Pool der beschriebenen Hand- 
lungseinheiten einzelne Sequenzen ausgewählt und mikroanalytisch untersucht 
werden. Um die Charakteristika der sprachlichen Interaktion aus der Perspekti- 
ve der pädagogischen Fachkraft präzise beschreiben zu können, müssen die Vi- 
deosequenzen transkribiert und in einzelne Turns segmentiert werden. Anhand 
der erstellten Transkripte soll dann untersucht werden, wie Erzieherinnen ihr 
sprachliches Verhalten in der Interaktion mit den ein- bis dreijährigen Kindern 
gestalten und welche Charakteristika diesen Interaktionsprozessen zugrunde 
liegen. Insbesondere soll in diesem zweiten Analyseschritt auf Aspekte der Res- 
ponsivität und den Einsatz von Scaffolding-Elementen (u.a. Kontextualisierungs- 
strategien und Strategien der Verständnissicherung) eingegangen werden. Für 
diesen Auswertungsschritt soll ein Beobachtungssystem entwickelt werden, das 
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die charakteristischen Scaffolding-Elemente in der bilingualen Kita möglichst 
gegenstandsangemessen abbildet. Dazu sollen zunächst aus der Forschungsli- 
teratur und bereits bestehenden Studien vorläufige Kategorien deduktiv in das 
Beobachtungssystem aufgenommen werden, um diese dann am Material zu pi- 
lotieren und um weitere, induktiv aus dem Material ableitbare Kategorien zu 
erweitern und auszudifferenzieren. 

Bezug nehmend auf die zweite Teilfrage der Forschungsfrage wird dieser qua- 
litative und mikroanalytische Auswertungsschritt anhand ausgewählter Beispie- 
le aus der Praxis der bilingualen Kita Aufschluss darüber geben, wie sprachliche 
Interaktionsprozesse zwischen pädagogischen Fachkräften und Kleinkindern 
in unterschiedlichen Situationen organisiert sind und welche Merkmale das 
sprachliche Interaktionsverhalten der deutsch- und englischsprachigen Fach- 
kräfte gegenüber den Kindern kennzeichnen. 


4. Fazit und Ausblick 


Anliegen des vorliegenden Beitrags war es, die Einsatzmöglichkeiten der Metho- 
de der Videografie im Elementarbereich am Beispiel einer Dissertationsstudie 
zur Erforschung von sprachlichen Interaktionsprozessen in einer bilingualen 
Kita aufzuzeigen. Die einleitenden Ausführungen haben verdeutlicht, dass die 
videobasierte Unterrichtsforschung vor allem vor dem Hintergrund technischer 
Neuerungen wie der Digitalisierung und der größeren Speicherkapazität von 
Computern und angesichts der Grenzen der teilnehmenden Beobachtung einen 
enormen Entwicklungsschub erfahren hat. So ist es heute im Gegensatz zu noch 
vor einigen Jahren aus technischer Sicht mit einem vergleichsweise geringen 
Aufwand möglich, große Mengen an audiovisuellen Daten zu produzieren (vgl. 
Abschnitt 1). Die methodischen Überlegungen im Kontext der beschriebenen 
Studie sollten jedoch auch veranschaulichen, dass neben technischen Gesichts- 
punkten noch weitaus mehr Faktoren bei der Entwicklung eines videobasierten 
Forschungsdesigns und der Vorbereitung einer Datenerhebung mittels Vide- 
grafie berücksichtigt werden müssen. Dies betrifft vor allem die Überlegungen 
zum Datenschutz, die in Videostudien eine nicht zu unterschätzende Bedeutung 
haben sowie die Kamera- und Invasivitätseffekte, die bei der Entwicklung eines 
Aufnahmekonzepts bedacht werden sollten (vgl. Abschnitt 3). 

Im Zuge videogestützter Beobachtungsverfahren entstehen komplexe und 
reichhaltige Daten. Aus diesem Grund sollte die methodische Herangehenswei- 
se an Videostudien ebenso mehrperspektivisch erfolgen. Die Videografie bie- 
tet sich daher für die Einnahme von unterschiedlichen Perspektiven auf einen 
Forschungsgegenstand und die Beantwortung von Forschungsfragen im Sinne 
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der Triangulation geradezu an. Das beschriebene Forschungsdesign versucht 
durch eine Kombination unterschiedlicher Methoden (Methodentriangulation) 
mit einer ersten quantifizierenden Basiskodierung, auf die die qualitative Mik- 
roanalyse einzelner Sequenzen folgt, einen prinzipiellen Erkenntniszuwachs an- 
zustreben (vgl. Flick 2011: 12). Ebenso verfolgt der Einsatz von zwei Beobachter/ 
innen (Beobachtertriangulation/Forschertriangulation) bei der Basiskodierung 
das Ziel, Beobachtereinflüsse abzufedern und zu vertieften Erkenntnissen zu ge- 
langen. Exemplarisch sei hier auch auf den vielversprechenden Vorschlag von 
Schramm/Aguado (vgl. 2010: 198) hingewiesen, die deskriptive Analyse von 
Videodaten mit introspektiven Datenquellen (z.B. lautes Denken, video-stimu- 
lierte retrospektive Interviews, videostimulierte Retrospektion) im Sinne einer 
Datentriangulation zu kombinieren. 

Da die technischen Herausforderungen der Videografie mittlerweile bewältigt 
sind, sollte sich die zukünftige Diskussion um den Einsatz der Videografie verstärkt 
der methodologischen Weiterentwicklung des Instruments und der Systematisie- 
rung von Auswertungsansätzen videobasierter Beobachtungsdaten widmen. Die- 
ser Punkt scheint angesichts der Publikationslage bis dato eine Lücke darzustellen. 
In diesem Kontext sollten vermehrt auch Ansätze der Triangulation in die Diskus- 
sion einbezogen werden, da es insbesondere für Videostudien lohnenswert sein 
kann, durch eine Kombination von verschiedenen Methoden, Daten, Theorien 
oder den Einsatz mehrerer Beobachter/innen einen mehrperspektivischen Zu- 
gang zum Forschungsgegenstand einzunehmen und dadurch einen prinzipiellen 
Erkenntniszuwachs bzw. Erkenntnisse auf unterschiedlichen Ebenen zu erzielen. 
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Ansätze zur Triangulation mithilfe qualitativer 
Forschungssoftware (MAXQDA 11) 


Claus Stefer 


Dieser Beitrag fokussiert den Einsatz von MAXQDA 11, einer Software zur 
Analyse qualitativer Daten, im Kontext von triangulativen Datenauswertungs- 
verfahren. Es werden die häufigsten und flexibelsten Triangulationsstrategien 
anwendungsorientiert aufgegriffen. Dargestellt werden sowohl einfache häu- 
figkeitsorientierte Verfahrensweisen als auch komplexere Techniken wie die 
Arbeit mit Variablen, Joint Displays, Summary Grids, Elemente der quantita- 
tiven Inhaltsanalyse sowie die Intercoder-Übereinstimmug als grundlegender 
Ansatz der Forscher-/innentriangulation. Der Beitrag ist auf die Forschungs- 
praxis hin ausgerichtet, d.h., dass die einzelnen Vorgehensweisen und die 
dahinterliegenden methodologischen Annahmen zunächst knapp vorgestellt 
werden, um im Anschluss ihre Umsetzung mithilfe von MAXQDA in den 
Blick zu nehmen. 


1. Einleitung 


Software zur Unterstützung des Forschungsprozesses hat sich als selbstverständ- 
licher Teil moderner sozialwissenschaftlicher Forschung etabliert. Verfolgte die- 
se Art Software zunächst vor allem das Ziel, etablierte Arbeitsabläufe qualitativer 
Forschung auf den Computer zu übertragen und so die Arbeit übersichtlicher 
und effizienter zu gestalten, so hat sich im Laufe von nunmehr über zwei De- 
kaden eine eigene Familie von Software für die qualitative Datenanalyse entwi- 
ckelt, die durch das breite Spektrum angebotener Analysemöglichkeiten neue 
Perspektiven für die Datenauswertung eröffnet. Diese Art Analyseprogramme 
wird im deutschen Raum in der Regel als QDA-Software bezeichnet - das Kürzel 
steht für Qualitative Datenanalyse -, im englischsprachigen Raum ist die Be- 
zeichnung CAQDAS (Computer Assisted Qualitative Data Analysis Software) ge- 
bräuchlich. Während der fortlaufenden Entwicklung konnte die Funktionalität 
der jeweiligen Programme nicht zuletzt aufgrund der rasant wachsenden Leis- 
tungsfähigkeit von Computern stetig wachsen. Die letzte Generation von QDA- 
Programmen kann demnach mit einer Fülle von Funktionen und Möglichkeiten 
aufwarten, die vor wenigen Jahren noch undenkbar gewesen wären. Sie eröff- 
nen völlig neue Perspektiven auf die Datenanalyse und können für eine Viel- 
zahl qualitativer Forschungsvorhaben eingesetzt werden. Mit ihnen lassen sich 
enorme Datenmengen verwalten und bearbeiten, sie erlauben die Integration 
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unterschiedlichster Dokument- und Medienarten, bieten flexible Teamwork- 
Funktionen an und erhöhen die Nachvollziehbarkeit des Forschungsprozesses. 
Eine besondere Stärke der Software liegt in ihrer Fähigkeit, unterschiedliche 
Forschungsmethoden und -logiken zu integrieren, um sie möglichst selbstver- 
ständlich auf denselben Datenkorpus anwenden zu können. Aber auch die Zu- 
sammenführung von Daten aus unterschiedlichen methodischen Quellen bzw. 
die Bereitstellung der Arbeitsergebnisse für die weitere Analyse mithilfe anderer 
Software beherrscht moderne QDA-Software. Somit bietet sie optimale Voraus- 
setzungen, die mehr und mehr üblichen Wege der Triangulation, Methodeninteg- 
ration und Mixed Methods effizient in der Forschungspraxis umzusetzen’. Dieser 
Beitrag untersucht anhand einer Betrachtung der Software MAXQDA (Version 
11), welche konkreten Möglichkeiten zur Triangulation QDA-Software anbietet. 


2. Grundkonzepte der Triangulation in QDA-Software 


QDA-Software stellt verschiedene Techniken zur Verfügung, Triangulationen 
vorzunehmen. Folgende Verfahrensweisen stellen dabei die dominanten dar: 
Integration qualitativer und quantitativer Daten und Forschungslogiken: Die- 
ser Aspekt beschreibt die Möglichkeit, standardisierte und nicht standardisier- 
te Daten in einem einzigen Datensatz zusammenzubringen, und zwar in einer 
Weise, die es einerseits ermöglicht, die Daten jeweils separat zu analysieren, sie 
jedoch auch unmittelbar und direkt miteinander zu verbinden. Ein Weg kann 
sein, separat vorliegende Daten in einer Software zusammenzuführen, um so 
alle Informationen unmittelbar kombiniert vorliegen zu haben, sie in der Ana- 
lyse aufeinander beziehen zu können und so anzureichern. Einen anderen Weg 
stellt die Möglichkeit dar, Forschungslogiken zu kombinieren, etwa direkt bei 
der interpretativ-bewertenden Einordnung von Textstellen eine Likert-Skala 


1 Dieser Beitrag befasst sich nicht mit den Unterschieden zwischen den Konzepten der 
Triangulation, Methodenintegration und der mixed methods, die jeweils eigene Stra- 
tegien und Vorgehensweisen verfolgen. Stattdessen werden diese Begriffe im vorlie- 
genden Beitrag auf einer sehr allgemeinen Ebene synonym verwendet. Damit wird 
vor allem der diesen Ansätzen gemeinsame Aspekt betont, Daten anzureichern, zu 
validieren, zu ergänzen und die Aussagekraft und Qualität einer Untersuchung zu 
steigern. Unter dem Begriff Triangulation werden hier somit allgemein Bestrebun- 
gen zusammengefasst, numerische und nicht numerische, standardisierte und nicht 
standardisierte Daten gemeinsam auszuwerten, aufeinander zu beziehen oder in die 
jeweils andere Form zu transformieren. Diese weit gefasste Begriffsverwendung soll 
keineswegs eine Gleichheit der verschiedenen Konzepte zum Ausdruck bringen. Für 
eine genauere Ausdifferenzierung der Begriffe vgl. Settinieri (in diesem Band). 
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anzuwenden. Darüber hinaus existieren Schnittstellen, die es ermöglichen, die 
Daten und Inhalte, die in der QDA-Software bearbeitet werden, auch an Statistik- 
Software zu übergeben, um speziellere Analysen durchführen zu können. 
Quantifizierung der qualitativen Analyse: QDA-Software ermöglicht es, ver- 
schiedenste Schritte, Tätigkeiten und Facetten qualitativer Analysearbeit auch in 
quantifizierter Form darzustellen. Wichtige Werkzeuge können hier etwa Code- 
häufigkeiten, die Anzahl der Überschneidungen von bestimmten Codes oder 
auch der prozentuale Anteil eines Dokumentes, der codiert wurde, (Codierdich- 
te) sein. Auch diese Informationen können an Statistik-Software übergeben wer- 
den, etwa um weitergehende Zusammenhangsanalysen durchführen zu können. 
Joint Displays: Sie ermöglichen, qualitative und quantitative Informationen 
in einer einzigen Übersicht zu vereinen und so gemeinsam darzustellen. Sie 
erlauben beispielsweise, die Aussagen nach quantitativen Merkmalen und Ei- 
genschaften sortiert auszugeben und gegenüberzustellen, etwa die Aussagen der 
befragten Personen sortiert nach ihrem höchsten formalen Bildungsabschluss. 
Quantitative Analyse qualitativen Materials: Neben rein oder vornehmlich inter- 
pretativen Vorgehensweisen existiert auch eine Reihe von Verfahren, mit deren Hilfe 
nicht standardisiertes - also qualitatives - Datenmaterial auf statistischer Basis aus- 
gewertet werden kann, so etwa die Quantitative Inhaltsanalyse. Auch die vergleichs- 
weise einfache Analyse von Worthäufigkeiten, die einen spannenden Einblick in den 
Wortschatz der zu analysierenden Dokumente und somit auch in die ausgedrückte 
Weltsicht des Dokumentes ermöglicht, ist dieser Art der Triangulation zuzurechnen. 
Teamwork: Moderne QDA-Software ermöglicht auf vielfältige Weise die Ko- 
operation von Forschenden und somit die Forscher-/innentriangulation. Aber 
auch die Untersuchung von Intercoder-Übereinstimmungen, die ein Merkmal 
für die Zuverlässigkeit der vorgenommenen Codierungen darstellt, wird ohne 
Weiteres ermöglicht. 
Auf diese fünf Grundkonzepte aufbauend werden in QDA-Software unter- 
schiedlichste Analysekonzepte umgesetzt, die es den Forschenden ermöglichen, 
Triangulationen den spezifischen Anforderungen entsprechend vorzunehmen. 


3. Triangulation in MAXQDA 11 


In MAXQDA 11 stehen Forschenden vielfältige Möglichkeiten zur Triangulati- 
on zur Verfügung. Nachfolgend werden die zentralen Funktionen der Software 
betrachtet. Dabei können an dieser Stelle nicht alle Funktionen der Software im 
Detail besprochen werden, sondern es wurde eine Auswahl getroffen, die sich 
am zu erwartenden Nutzwert der Funktionen für ein breites Publikum orientiert 
und für eine große Zahl unterschiedlicher Forschungskontexte nutzbar ist. 
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Vor der Betrachtung der einzelnen Funktionen ist ein prinzipieller Hin- 
weis auf einen aus qualitativ-interpretativer Perspektive wesentlichen Aspekt 
der Arbeit mit Quantifizierungen unerlässlich: Quantitäten, beispielsweise 
die Häufigkeit von Codierungen, sind zwar als unzweifelhaftes Faktum zu be- 
trachten, ein direkter Rückschluss von Häufigkeiten auf inhaltliche Relevanzen 
ist allerdings nicht unbedingt zulässig. Nur weil etwa eine Kategorie während 
des Codierens besonders häufig angewendet wurde, ist sie nicht automatisch 
besonders wichtig. Genauso gut könnte sie einfach die ungenaueste Kategorie 
sein oder aber diejenige, die bewusst am breitesten definiert wurde. Anderer- 
seits macht es einen deutlichen Unterschied, ob beispielsweise ein Code, der 
qua Definition in jedem Dokument maximal einmal vergeben werden kann, 
bei einem 30 Dokumente umfassenden Forschungsprojekt vier- oder 24-mal 
angewendet wurde. Die Forscher/innen haben demnach stets die Aufgabe, die 
Erkenntnisse oder Vermutungen, die sich aus der Arbeit mit Quantifizierungen 
ergeben, an den qualitativen Kontext rückzubinden, aus dem sie hervorgehen 
bzw. den sie abbilden, sie daran zu überprüfen und die inhaltliche, qualitative 
Dimension dieser Zahlenwerte zu erschließen. Die substanzielle Zusammen- 
führung und Rückbindung der einzelnen Elemente ist somit von entscheiden- 
der Bedeutung. Oder anders formuliert: Die Zahlen lügen nicht, bedürfen aber 
spezifischer Analyse. 


3.1 Grundlegende Quantifizierungen: Code- und 
Überschneidungshäufigkeiten 


Die grundlegendste Stufe der Quantifizierung steht in MAXQDA permanent 
und ohne gesonderten Aufruf zur Verfügung: Hinter jedem Dokument wird 
die Anzahl der in ihm codierten Dokumentstellen in Zahlenform angezeigt. 
Gleiches gilt für die Codes, auch hier wird hinter jedem Code als Zahl ausgege- 
ben, wie viele Dokumentstellen ihm zugeordnet wurden. Diese Zahlen werden 
automatisch während der Arbeit mit den Daten erzeugt und aktualisiert und 
bilden somit die interpretative Arbeit numerisch ab. Allerdings bleiben diese 
Werte immer auf Ebene eines Dokumentes oder eines Codes und sind kumu- 
lativ, also nicht differenziert. Um diese Werte differenzierter zu betrachten, 
kann mithilfe der Funktion Übersicht Codings sowohl für ein Dokument als 
auch für einen Code eine tabellarische Übersicht aller im Dokument codier- 
ten bzw. dem Code zugeordneten Passagen aufgerufen werden. Dazu wird das 
betreffende Dokument oder der betreffende Code mit der rechten Maustaste 
angeklickt, um aus dem erscheinenden Menü den Eintrag Übersicht Codings 
aufzurufen. 
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Abb. 1: Übersicht über alle codierten Textstellen (=Codings) des Dokuments B10. 


% Codings 
Dokument: B10 45 Codings aus 1 Dokumenten und 0 Dokumentgruppen 
aB x 


‚Also was wir natürlich immer machen sind Seminar-Evaluationen. 


Vorverständnis Evaluation/Grundlagen/Erfahrungen\Definition ... B10: Für mich bedeutet... 


Vorverständnis Evaluation/Grundlagen/Erfahrungen \Information Ich weiß, dass [Auftrag 

j Vorverständnis Evaluation/Grundlagen/Erfahrungen\informati... | | I: Das gab es, okay. Ha. 
| Vorgeschlagene Probandengruppen \studierene—_2L | 20 | Das sind a) die Studenten 
Vorgeschlagene Probandengruppen \Seminarleiter_innen/Ausbi... das sind aber b) auch z... 
Vorgeschlagene Probandengruppen\-ehrende Dann müsste man natür... 
Vorgeschlagene Probandengruppen Werwltung/Schuamt/Poitk 20 | Und im Idealfall müsste... 
Vorgeschlagene Probandengruppen \Referendare/Absolventen Ja, natürlich die Leute, ... 
Beiträge der Probandengruppen \Referendare/Absolventen\Rü... B10: Ja, ob ihnen das, ... 
Beiträge der Probandengruppen\Studierende\Studienpraxis\B... ‚Also erstens, glaube ich... 
Beiträge der Probandengruppen \Lehrende \Selbstverständnis/... Habt ihr euch klar gema... 
Beiträge der Probandengruppen \erwätung/schuamt/oltik. Sind die Ausbidungskon... 


lo ololololo ol olololololo. 


Eine weitergehende, vergleichende und daher besser für das Erlangen eines 
Überblicks geeignete Darstellung der Codehäufigkeiten stellt der Code-Mat- 
rix-Browser (Menü Visual Tools) zur Verfügung. Er erlaubt, die Häufigkeiten 
der Codierungen für jeden Code und jedes Dokument gleichzeitig kumu- 
liert in grafischer Form in einer Tabelle darzustellen. Der Code-Matrix- 
Browser ist ein Gitter, in dem jede vorgenommene Codierung in Form eines 
Quadrates repräsentiert wird. Je häufiger ein bestimmter Code in einem 
Dokument vergeben wurde, desto größer wird das Quadrat in der Grafik 
dargestellt. Wurde ein Code nicht angewendet, bleibt die betreffende Po- 
sition leer. Neben dieser grafischen Form der Darstellung ermöglicht der 
Code-Matrix-Browser aber auch, die absoluten Codierhäufigkeiten als Zahl- 
werte auszugeben. Diese alternative Anzeigeform ist deutlich präziser, da die 
grafischen Symbole kleine Unterschiede der Häufigkeiten unter Umständen 
nicht abbilden können, dafür sind Maxima und Minima schwieriger aus- 
zumachen. Die Informationen dieser Grafik, also die Anzahl der codierten 
Textstellen je Code in jedem Dokument, lassen sich ohne Weiteres über ein 
entsprechendes Icon in Form einer Tabelle exportieren. Dadurch besteht 
eine direkte Anknüpfung an die Welt der statistischen Datenanalyse, bei- 
spielsweise um mithilfe einer Software für statistische Analysen Korrelatio- 
nen zwischen Codes zu berechnen. 
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Abb. 2: Ausschnitt aus einem Code-Matrix-Browser. 


am Code-Matrix-Browser 


a] GI] E aM 


seteanndoen 
‚odesyster _B01 
D-E Lernstrategien 
@) Individuelle Voraussetzunge... 
B-E Lernverlauf 
B-E) Teilnahmeverlauf an de... 
@ die alles Wahrnehm... 
(Œ) Vl und Übungsbasiert 
© Tutoriumslerner 
©-@ Lernen außerhalb der V... 
© lerne nicht 
| © lerne viel 
B-E Erwartung Klausurnote 
E gut 
=@) zwei bis drei 
E mittel 
i@) Hauptsache durch 


Als Ergänzung zu dieser Übersichtsdarstellung der Codehäufigkeiten erlaubt der 
Code-Relations-Browser (Menü Visual Tools) in gleicher Darstellungsform, also so- 
wohl grafisch als auch numerisch, die Anzeige der Überschneidungen und Nähe 
von Codes. Die erzeugte Grafik gibt folglich Aufschluss darüber, wie vielen Text- 
stellen mindestens zwei Codes zugewiesen wurden. Dazu wird eine Matrix erzeugt, 
die sowohl in den Spalten als auch in den Zeilen frei wählbare Codes enthält. An 
der Schnittstelle von Zeilen und Spalten wird jeweils als Grafik oder Zahl ausgege- 
ben, wie häufig sich die beiden betreffenden Codes überschneiden. Dabei kann de- 
finiert werden, ob es sich um reale Überschneidungen handelt, eine Textstelle also 
tatsächlich beiden Codes zugewiesen wurde, oder ob sich die Codierungen in der 
Nähe zu einander befinden. Die Nähe wird dabei in Form von Absätzen definiert, 
die zwischen dem Vorkommen der beiden Codes im gleichen Text liegen können. 


Abb. 3: Suche nach tatsächlichen Überschneidungen der drei Codes in der ersten Spalte mit 
anderen Codes anhand der Darstellung im Code-Relations-Browsers. 


Cu Code-Relations-Browser 


stamnam=salaaleo|ix 4 
[Codesystem | Studi... | Bewer... | Vorbe... | Bedar... | Erwar... | Lerne... Lehrende Lehry... | Inhalt... | Orga... | Fachd... | Selbst... | Sicht | 
Œa Studienorganisation/Rahmenbedingungen . $ Fi p x 


Œa Bewertung/Zufriedenheit 


| $Œ Lernerfolg/Wissen/erlernte Inhalte 


Code, X-Achse: Beiträge der Probandengruppen\Studierende\Studienpraxis\Studienorganisation/Rahmenbedingungen 
Code: Yadhse: Beiträge der Probandengruppen \Studierende\Lernerfolg/Wissenferlernte Inhalte 
idungen: 1 


Diese Darstellungen der Quantitäten gestatten den Forschenden, einen schnellen 
Überblick über die Vergabe von Codes zu gewinnen und so einen neuen, ergänzen- 
den Eindruck von der zahlenmäßigen Bedeutung des Kategoriensystems und seiner 
Teile zu erhalten. Ein Blick auf die bloßen Häufigkeiten der Codierungen je Code 
und je Dokument sowie auf die jeweiligen prozentualen Anteile kann Hinweise be- 
züglich der Relevanz einer Kategorie, der Erfordernis einer neu vorzunehmenden, 
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präziseren Codedefinition oder der inhaltlichen Dichte eines Dokumentes her- 
vorbringen. Dem Code-Matrix-Browser kann unter anderem schnell entnommen 
werden, welche Dokumente besonders viele Codierungen zu einem bestimmten 
Code enthalten oder welcher Code in einem Dokument der dominante ist, und 
zwar jeweils, wenn gewünscht, im Kontext aller bearbeiteten Dokumente. Der 
Code-Relations-Browser zeigt auf, welche Codes häufig gleichzeitig vergeben wur- 
den, somit eventuell von ihrer inhaltlichen Bedeutung her zusammentreffen, oder, 
in der Sequenz der zugrunde liegenden Dokumente gedacht, sich in der Nähe zuei- 
nander befinden - beides können Hinweise auf einen inneren Zusammenhang der 
betreffenden Codes, ggf. aber auch auf unzureichende Kategoriendefinitionen sein. 
Diese Art grundlegender Quantifizierungen stellt in vielen Fällen neben den 
klassischen methodenspezifischen Vorgehensweisen einen ersten wichtigen An- 
laufpunkt während des Analyseprozesses dar. Sie sind sehr gut geeignet, Ideen 
bezüglich der Relevanz von Codes oder zu Zusammenhängen zu entwickeln. 
Sie können Hinweise auf die Güte des Kategoriensystems geben. Sie erlauben es 
gewissermaßen, die inhaltlich-interpretative Tätigkeit des Codierens aus einem 
neuen Blickwinkel und im erweiterten Kontext des Gesamtprojekts, aber, wenn ge- 
wünscht, auch im Kontext einzelner ausgewählter Dokumente zu betrachten. Die 
eigentliche Interpretation der Textstellen verliert in dieser distanzierteren Sicht- 
weise zunächst etwas an Relevanz, jedoch nur, um im Anschluss bei der Erschlie- 
Bung der Bedeutungen wieder substanziell in die Analyse einbezogen zu werden. 


3.2 Gewichtung von Codierungen 


MAXOQODA bietet die Möglichkeit, jeder Codierung ein eigenes Gewicht zu ver- 
leihen. Technisch gesprochen kann so jeder Codierung als Attribut eine Zahl 
zwischen 0 und 100 zugewiesen werden. Diese Zuweisung stellt einen Interpre- 
tationsakt dar und muss demnach für jede Codierung individuell vorgenommen 
werden. Lediglich das Standardgewicht, also der Wert, der jeder neuen Codie- 
rung automatisch zugewiesen wird, lässt sich über den Eintrag Optionen im Menü 
Projekt einstellen. Die Voreinstellung 0 wird in der Regel als nicht gewichtet ver- 
wendet. Das Gewicht einer Textstelle wird verändert, indem der Codierstreifen 
des betreffenden Codings mit der rechten Maustaste angeklickt wird, woraufhin 
die Möglichkeit Gewicht ändern angeboten wird. Das zugewiesen Gewicht wird 
unter anderem angezeigt, wenn der Mauszeiger über den Codierstreifen bewegt 
wird und dort eine Weile ruht, es wird aber auch in den gelben Infoboxen (Her- 
kunftsangabe) in der Liste der Codings im oberen blauen Balken ausgegeben. 
Anhand der Gewichtungen wird es möglich, die Auswahl anzuzeigender Text- 
stellen differenzierter zu gestalten. Im Menü Analyse werden die Möglichkeiten 
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geboten, den Gewichtsfilter bearbeiten und den Gewichtsfilter anwenden zu kön- 
nen. Die erste Option gestattet es, eine Wertespanne zu definieren. Die zweite 
Funktion wendet daraufhin die vorgenommenen Einstellungen auf die Liste der 
Codings an: Wird der Gewichtsfilter aktiviert, so werden in der Liste der Codings 
ausschließlich jene Codings der aktivierten Dokumente und Codes gelistet, deren 
Gewicht innerhalb der definierten Gewichtsspanne liegt. Es handelt sich also um 
eine effiziente Filtermöglichkeit. 


Abb. 4: Beschränkung der anzuzeigenden Codings auf solche mit einem Gewicht der 
Spanne 5-10. Das tatsächliche Gewicht einer Textstelle wird in der oberen rechten Ecke 
der zugehörigen Herkunftsangabe (Kasten auf der linken Seite) angezeigt. 
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Für die praktische Verwendung dieser numerischen Information bieten sich 
viele Möglichkeiten. Populär ist die Gewichtung beispielsweise als Möglich- 
keit der Skalierung, etwa auf als Möglichkeit der inhaltlichen Kennzeichnung 
oder als Umsetzung der Fuzzy Sets der QCA (Qualitative Comparative Ana- 
lysis, siehe Ragin 2000). Das erste Beispiel ließe sich etwa dergestalt umset- 
zen, dass einer Textstelle direkt nach ihrer Codierung ein Attribut in Form 
des Gewichts zugewiesen wird. Auf diese Weise könnten beispielsweise Text- 
stellen gekennzeichnet werden, die zwar prinzipiell einem Code zuzuordnen 
sind, ihn aber nicht im Kern treffen oder von minderer inhaltlicher Qualität 
sind. Ein solches Coding könnte etwa mit einer 1 ausgezeichnet werden. An- 
dersherum könnten auch Textstellen, die einen hervorragenden Beitrag zum 
jeweiligen Code liefern, ebenso kenntlich gemacht werden, in diesem Beispiel 
vielleicht mit dem Wert 10. Das zweite Beispiel bezieht sich auf eine eigene 
analytische Methode, die QCA mit Fuzzy Sets. Hierbei handelt es sich um ein 
Verfahren, das zweidimensionale Merkmalsräume definiert. Jedes Dokument 
oder je nach konkreter Anwendung auch jede einzelne relevante Dokument- 
passage wird dann innerhalb dieser Merkmalsräume auf einer prozentualen 
Skala verortet. In dieser Logik würde das Gewicht diese Verortung verkör- 
pern. So könnte beispielsweise der Grad der Demokratisierung von Ländern 
erfasst werden: Das Gewicht des Codes Grad der Demokratisierung würde für 
jedes Land abbilden, ob es sich um eine reife, funktionierende und vollständi- 
ge Demokratie (bspw. Gewicht = 100), ein Land gänzlich ohne demokratische 
Strukturen (Gewicht = 0) oder vielleicht auch eine Zwischenform mit vielen 
demokratischen Elementen, jedoch nicht in allen Bereichen der Gesellschaft 
(bspw. Gewicht = 75) handelt. Die zu vergebenden Gewichtswerte müssen 
dabei möglichst anhand festgelegter Definitionen reproduzierbar vergeben 
werden. 

Das weitere Verfahren ist prinzipiell identisch: Während des Retrievals, also 
während des Aufrufens und Anzeigens der codierten Textstellen, kann durch 
Verwendung des Gewichtsfilters sehr fein bestimmt werden, auf Textstellen wel- 
chen Merkmals die Anzeige beschränkt werden soll. 


3.3 Dokument- und Codevariablen: Erweiterte 
Triangulationsmöglichkeiten 


Zu jedem Dokument und zu jedem Code können in MAXQDA ergänzen- 
de Informationen hinterlegt werden. In der Regel handelt es sich dabei um 
Daten, die für die Analyse und das Verständnis und die Einordnung der Do- 
kumente zwar relevant sind, selbst aber in MAXQDA nicht oder zumindest 
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nicht in erster Linie interpretativ bearbeitet werden sollen. Prototypisch für 
Dokumentvariablen wären etwa soziodemografische Daten sowie weitere re- 
levante Eigenschaften von Interviewpartner/innen, aber auch Ergebnisse einer 
qualitativen Typenbildung. Codevariablen können beispielsweise im Kontext 
der Grounded Theory (siehe u.a. Corbin/Strauss 2008, Strübing 2008) einge- 
setzt werden, um die Zugehörigkeit von Konzepten zu Kategorien abzubilden 
oder, wenn Gruppendiskussionen bearbeitet werden, um die Eigenschaften der 
beteiligten Sprecher/innen zu erfassen. Da das prinzipielle Vorgehen für die 
Arbeit mit Dokument- und Codevariablen identisch ist, die Dokumentvari- 
ablen aber deutlich häufiger eingesetzt werden und für das Thema der Tri- 
angulation auch relevanter sind, fokussiert die nachfolgende Darstellung die 
Dokumentvariablen. 

Neben einigen sog. Systemvariablen, die MAXQDA automatisch zu jedem 
eingelesenen Dokument erzeugt und die für die interne Datenverwaltung benö- 
tigt werden, können Forschende selbst Variablen definieren. Jede Variable steht 
für jedes Dokument zur Verfügung. Die Darstellung der Daten erfolgt in einer 
Tabelle gemäß den für solche Datendarstellungen üblichen Konventionen, d.h. 
dass für jedes Dokument eine Zeile verfügbar ist und für jede existierende Vari- 
able eine eigene Spalte erzeugt wird. Um die Liste der Dokumentvariablen auf- 
zurufen, kann der Befehl Dateneditor (Dokumentvariablen) im Menü Variablen 
ausgewählt werden. Im sich dann öffnenden Fenster können Werte angesehen, 
neu eingegeben und verändert werden. 


Abb. 5: Ausschnitt des Dateneditors (Dokumentvariablen). 
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Um neue Variablen zu definieren, wird über den Eintrag Liste der Dokumentva- 
riablen, der sich ebenfalls im Menü Variablen befindet, der entsprechende Dia- 
log aufgerufen’. Wird das Icon zur Erzeugung einer Neuen Variable angeklickt, 
muss als nächstes definiert werden, welchen Namen die neue Variable erhalten 
soll und um welchen Datentyp es sich handelt. Zudem ist es möglich, eine Zei- 
chenkette zu hinterlegen, anhand derer fehlende Werte identifiziert werden. Der 
Name der Variable kann frei gewählt werden. Der Typ einer Variablen definiert, 
welche Art von Daten die neue Variable aufnehmen kann. Sollen neben Ziffern 
auch weitere Zeichen wie Buchstaben oder Sonderzeichen hinterlegt werden, so 
muss als Typ String gewählt werden, da außer diesen Stringvariablen keine an- 
dere Variable Buchstaben entgegen nimmt. Daneben sind noch die Variablenty- 
pen Ganzzahl zur Speicherung von Ziffern (etwa Geburtsjahr), Fließkommazahl 
zum Hinterlegen von Werten mit Nachkommastellen (beispielsweise die Abitur- 
durchschnittsnote), Datum/Uhrzeit sowie Boolean verfügbar. Der Variablentyp 
Boolean ist zweiwertig, d.h. er ermöglicht die Hinterlegung von lediglich zwei 
unterschiedlichen Werten: Vorhanden bzw. erfüllt und nicht vorhanden bzw. 
nicht erfüllt. Während für alle anderen Variablentypen ein Eingabefeld bereitge- 
stellt wird, in das die betreffenden Werte eingetragen werden können, wird für 
Boolean-Variablen eine Checkbox dargestellt, die abgehakt werden kann. Vor- 
handen bzw. erfüllt wird dann durch ein gesetztes Häkchen dargestellt. Diese Va- 
riablenart eignet sich demnach für die Erfassung von Merkmalen, die entweder 
zutreffen oder eben nicht, also beispielsweise das Funktionsmerkmal Schulleiter/ 
in oder die Zuordnung einer interviewten Person zum während der Analyse ge- 
bildeten Typus Verweigerer. 

Nicht zufällig ähneln diese Beschreibung und die verwendeten Begriffe Ver- 
fahren aus der Welt der statistischen Datenanalyse: Die Variablen stellen einen 
zentralen Verbindungspunkt zwischen qualitativen und quantitativen Daten in 
MAXODA dar. Dabei geht es nicht nur darum, die Informationen einfach in 
einer Datei zusammenzuführen. Vielmehr wird der Ansatz verfolgt, das qua- 
litative und das quantitative Methodenspektrum möglichst eng und unkom- 
pliziert, gleichzeitig aber so flexibel wie möglich zusammenzuführen. Hierzu 
gehört unter anderem, dass es nicht erforderlich ist, bereits in Tabellenform 
vorliegende Daten - z.B. aus SPSS, Stata oder Excel - in MAXQDA erneut ein- 
zugeben, sondern es ist möglich, sie mithilfe der Funktionen Daten exportieren 
(Dokumentvariablen) und Daten importieren (Dokumentvariablen) im Menü 


2 Für viele Funktionen bietet MAXQDA mehr als eine Möglich wird stets nur eine 
Zugriffsmöglichkeit beschrieben. 
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Variablen unkompliziert nach MAXQDA zu transferieren. Das Spektrum der 
Verwendungsmöglichkeiten ist sehr breit gestreut, viele der komplexeren Analy- 
setechniken, die in MAXQDA zur Verfügung stehen, basieren entweder auf Va- 
riablen oder sind in der Lage, die in der Variablenliste hinterlegten Werte in die 
Auswertung einbeziehen. Nachfolgend werden die wichtigsten Einsatzmöglich- 
keiten der Variablen vorgestellt, die sich im Kontext vieler Forschungsprojekte 
als fruchtbar erweisen können. 


Variablenwerte als ergänzende Information und als Grundlage 

manueller Auswahl 

Die einfachste Möglichkeit, die Variablenwerte für die Analyse zu nutzen, ist, 
sie als ergänzende Kontextinformation zu betrachten und bei Bedarf aufzu- 
rufen. Dazu kann aus dem Kontextmenü eines Dokumentes, das mit einem 
Rechtsklick auf das betreffende Dokument aufgerufen wird, direkt der Ein- 
trag Übersicht Variablen ausgewählt werden. Im sich öffnenden Fester werden 
alle zu diesem spezifischen Dokument hinterlegten Variablenwerte angezeigt. 
Dieser Weg führt sozusagen von den qualitativen Daten zu den quantitativen 
Variablenwerten. Doch auch in umgekehrter Logik, also in Richtung von den 
Variablen zu den qualitativen Daten, lassen sich die Variablen sehr einfach ein- 
setzen. In diesem Fall würden die Variablen als Kriterium zur manuellen Aus- 
wahl von Fällen mit interessanten und relevanten Merkmalen herangezogen. 
Ausgangspunkt ist dann der Dateneditor (Dokumentvariablen). Klickt man mit 
linker Maustaste auf einen der Spaltenköpfe, die den Namen der Variablen ent- 
halten, so wird die Liste nach den Werten dieser Spalte aufsteigend sortiert, 
ein erneuter Klick kehrt die Sortierreihenfolge um. So könnten die Dokumente 
etwa nach dem Alter der datengebenden Personen sortiert werden. Auf diese 
Weise wird das Spektrum der hinterlegten Werte sehr schnell sichtbar. Um ein 
Dokument nun zu betrachten oder zu analysieren, klickt man mit der rechten 
Maustaste auf die entsprechende Zeile und wählt den Eintrag Dokument öffnen. 
Auf diese Weise lässt sich beispielsweise einfach und schnell untersuchen, ob 
die Vermutung, dass bestimmte in Variablen erfasste Merkmale mit inhaltli- 
chen Äußerungen der Befragten in Verbindung steht, weiter verfolgt werden 
sollte oder nicht. Letztlich handelt es sich um nichts anderes als eine einfache 
Form von Gruppenvergleichen bzw. einer tendenziell eher explorativen Suche 
nach Mustern. 
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Abb. 6: Aufruf eines Dokumentes über das Fenster Dateneditor (Dokumentvariablen). Die 
Einträge des Dateneditors wurden durch Klick auf die Spaltenüberschrift nach der Variable 
Mathenote im Abitur (Punkte) absteigend sortiert, so dass die Personen mit der höchsten 
Punktzahl nach oben und jene mit der niedrigsten Punktzahl unten sortiert wurden. 

Ein Rechtsklick auf eine Zeile ermöglicht den direkten Aufruf eines interessierenden 
Dokuments. 
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Aktivierung via Dokumentvariablen 

In die gleiche Richtung weisend, hinsichtlich der sich bietenden Möglichkeiten 
jedoch deutlich weitreichender, ist die Funktion Aktivierung via Dokument- 
variablen (in MAXQDA vor Version 11 lautet der Name dieser Funktion Logi- 
sche Aktivierung). Dabei handelt es sich um die Möglichkeit, automatisiert aus 
der Liste der Dokumente all jene zu aktivieren, die den vorgegebenen Kriterien 
entsprechen. Als Kriterien, die zur Auswahl herangezogen werden können, die- 
nen wiederum die hinterlegten Variablenwerte. Damit ermöglicht diese Funk- 
tion u.a. einen Rückgriff auf standardisierte, quantitative Informationen als 
Auswahlkriterium. 

Die Aktivierung via Dokumentvariablen kann über das Menü Mixed Methods 
aufgerufen werden. Im sich öffnenden Dialog werden eine oder mehrere Bedin- 
gungen definiert, auf die hin der Datenkorpus überprüft werden soll. Entspricht 
ein Dokument den vorgegebenen Bedingungen, so wird es aktiviert, andern- 
falls deaktiviert. Dabei kann auf sämtliche im Projekt erzeugten Variablen zu- 
rückgegriffen werden. Zudem können mehrere Variablenbedingungen mit den 
Operanden und sowie oder miteinander verknüpft werden, so dass auch sehr 
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komplexe Bedingungen abgebildet werden können. Unter der Voraussetzung, 
dass die entsprechenden Informationen als Variablen hinterlegt wurden, ist es 
mithilfe dieser Funktion ein Leichtes, die Analyse beispielsweise auf Dokumente 
der Angehörigen einer bestimmten Partei in einer bestimmten Funktion in ei- 
nem bestimmten politischen Gremium zu beschränken und im nächsten Schritt 
eine ganz andere Gruppe zu wählen. Vor allem in Verbindung mit der Mög- 
lichkeit, die aktivierten Dokumente in sog. Sets, in frei zu erzeugenden Grup- 
pen von Dokumenten zu organisieren, ermöglicht diese Funktion sehr elegant, 
Dokumente gezielt und flexibel gruppenspezifisch für die Analyse auszuwäh- 
len. Dabei ist diese Funktion nicht nur bei großen Projekten mit umfangreichen 
Datenkorpora hilfreich, in denen eine manuelle Auswahl aufgrund der schieren 
Masse der Dokumente unpraktikabel wäre. Durch die Möglichkeit der Verknüp- 
fung mehrerer Bedingungen bietet sich ihr Einsatz auch in Projekten mit nicht 
zu vielen zu analysierenden Dokumenten an und erspart langwierige manuelle 
Wertevergleiche. 


Umwandlung von Codes in Dokumentvariablen 

Neben der Möglichkeit, selbst neue Variablen zu erzeugen und Daten einzu- 
geben, erlaubt MAXQDA auch, Codes automatisiert in Dokumentvariablen 
zu transformieren. Dazu wird der Eintrag In Dok.-Variable transformieren aus 
dem Menü aufgerufen, das erscheint, wenn mit der rechten Maustaste auf einen 
Code geklickt wurde. Im Anschluss öffnet sich der Dateneditor (Dokumentvari- 
ablen) und zeigt die neu erzeugte Spalte ganz am rechten Rand der Tabelle an. 
Als Überschrift, also als Variablennamen, trägt die Spalte den Namen des Codes. 
Darunter trägt MAXQDA für jedes Dokument als Zahl ein, wie häufig der be- 
treffende Code im jeweiligen Dokument vergeben wurde. Damit steht dieser 
Wert direkt als mögliches Kriterium zur Dokumentenauswahl zur Verfügung, 
da beispielsweise die Aktivierung via Dokumentvariablen auf Basis dieser Werte 
umgesetzt werden können. Beispielsweise ließen sich nun automatisiert alle Do- 
kumente mithilfe der Aktivierung via Dokumentvariablen wählen, die besonders 
viele oder eben besonders wenige Codings zum betreffenden Code beinhalten. 
Diese Funktion ermöglicht also die Auswahl von Dokumenten aufgrund von 
quantifizierten Codiermerkmalen. 
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Abb. 7: Ergebnis der Umwandlung des Codes in eine Dokumentvariable: Für jedes 
Dokument wird in der Variablenliste vermerkt, wie häufig der umgewandelte Code 

im betreffenden Dokument vergeben, d.h. wie viele Dokumentstellen mit ihm codiert 
wurden. Die Werte einer solchen Variable können für alle hier beschriebenen Operationen 
vollwertig genutzt werden. 
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Umwandlung von Codes in kategoriale Dokumentvariablen 

Kategoriale Variablen bieten die Möglichkeit, Bewertungen, die in Form von 
Subcodes vorgenommen wurden, als Variablenausprägung abzubilden und so 
für die weitere Analyse mit den oben beschriebenen Methoden zugänglich zu 
machen. Voraussetzung ist ein Code, dem nominal oder auf einer höheren Stu- 
fe skalierte Subcodes zugeordnet wurden. So könnten beispielsweise dem Code 
Bewertung von Veranstaltung und Inhalt in einer qualitativen Evaluationsstudie 
die Subcodes Positiv, Neutral sowie Negativ zugeordnet werden. Während des 
Codierens würden nun relevante Textstellen nicht dem Obercode zugewiesen, 
sondern die codierende Person würde direkt beurteilen, welche Bewertungs- 
tendenz eine Textstelle ausdrückt und sie dann direkt dem entsprechenden 
Subcode zuweisen. Um diese Codierungen als Variablenwerte zugänglich zu 
machen, wird mit einem Rechtsklick auf den Hauptcode Bewertung von Ver- 
anstaltung und Inhalt das Kontextmenü aufgerufen, aus dem dann der Eintrag 
In kategoriale Dok.-Variable transformieren aufgerufen wird. Es öffnet sich der 
Dateneditor (Dokumentvariablen) und zeigt am rechten Ende die neu erzeugte 
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Spalte, die wiederum den Namen des Codes als Bezeichnung trägt. Als Wert 
wird die Bezeichnung des Subcodes von Bewertung von Veranstaltung und In- 
halt ausgegeben, der in dem betreffenden Dokument am häufigsten vergeben 
wurde, also entweder Positiv, Neutral oder Negativ. Wurden mindestens zwei 
Subcodes gleich häufig vergeben, so wird als Wert nicht definiert eingetragen. In 
diesen Fällen müssen die Forscher/innen die entsprechend codierten Segmen- 
te inspizieren und eine Entscheidung über den adäquaten Variablenwert fällen. 
Diese Funktion klassifiziert demnach qualitative Bewertungen aufgrund ihrer 
Häufigkeiten. Auf dieser Basis wäre es nun ohne weiteres möglich, die Analyse 
mithilfe der Funktion Aktivierung via Dokumentvariablen auf jene Dokumente 
zu begrenzen, deren Datengeber/innen vornehmlich negative Bewertungen ab- 
gegebenen haben, um sie im nächsten Schritt mit jenen zu vergleichen, die sich 
mehrheitlich positiv geäußert haben. 


Abb. 8: Ergebnis der Umwandlung eines Codes in eine kategoriale Variable: In die automatisch 
während der Umwandlung erzeugte Variable mit dem Namen des Codes (Standardisierte 
Erhebung) wird für jedes Dokument eingetragen, welcher der Subcodes in dem betreffenden 
Dokument am häufigsten vergeben wurden. Nicht definiert bedeutet, dass mindestens zwei 
Subcodes gleich häufig vergeben wurden. 
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Statistiken 
Eine in MAXQDA 11 neu hinzugekommene Möglichkeit, mit Quantifizierun- 
gen zu arbeiten, stellen Statistiken dar. Diese Funktion ermöglicht es, die Daten, 
die in der Variablenliste hinterlegt wurden, direkt in MAXQDA mithilfe von 
Methoden deskriptiver Statistik zu bearbeiten, um für einfache Betrachtungen 
den Weg zur Statistik-Software vermeiden zu können. Zu Verfügung stehen 
absolute und relative Häufigkeiten, Mittelwerte und die Standardabweichung. 
Zudem können verschiedene Diagramme erzeugt und in ihrem Erscheinungs- 
bild verändert werden. Neben der Möglichkeit, standardisierte Informationen 
schnell und direkt innerhalb der QDA-Software auszuwerten, bietet sich diese 
Verfahrensweise im Sinne der Triangulation auch an, um qualitative Informati- 
onen auszuwerten, die während der Analyse erzeugt und als Variable hinterlegt 
wurden, ohne ein weiteres Analyseprogramm bemühen zu müssen. Auch hier 
wäre ein klassisches Beispiel die Zuordnung von Dokumenten zu im Rahmen ei- 
ner Typenbildung identifizierten und als Variablenausprägungen festgehaltenen 
Typen. Um solche Statistiken für Variablen zu erzeugen, kann der Menüpunkt 
Statistik für Dokumentvariablen im Menü Variablen aufgerufen werden. 

Neben der Möglichkeit, Variablenwerte auf diese Weise auszuwerten, ist es auch 
möglich, eine differenzierte quantifizierte Übersicht über Subcodes zu erzeugen. 
Dazu wird über das Menü Mixed Methods oder das Menü Codes der Eintrag Statistik 
für Subcodes ausgewählt. Im Anschluss muss angegeben werden, für welche Haupt- 
codes Statistiken erzeugt werden sollen. Anschließend werden die Subcodes des 
oder der gewählten Codes in Tabellenform aufgelistet. Zu jedem Subcode werden 
die absolute und die relative Häufigkeit seiner Anwendung im Projekt oder, je nach 
Vorauswahl, in Teilen des Projektes dargestellt. Auch hier können, wie bei den ande- 
ren Statistikfunktionen, auf Wunsch Diagramme der Verteilungen erzeugt werden. 


Abb. 9: Säulendiagramm für die Variable Geburtsland. 


ul Statistik (Variablen) 
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3.4 Joint Displays 


Der Begriff Joint Displays bezeichnet, zurückgehend auf Creswell/Plano-Clark 
(2011: 226), die gemeinsame Darstellung von qualitativen und quantitativen Da- 
ten in einer Tabelle oder Grafik, um sie direkt vergleichen zu können. Sie sind 
somit ein zentrales Element der Zusammenführung und Auswertung von In- 
formationen unterschiedlicher Art und Herkunft. MAXQDA 11 ermöglicht die 
Erzeugung von vier unterschiedlichen Joint Displays: Segmentmatrizen, Kreuz- 
tabellen, Typologietabellen sowie Konfigurationstabellen. 


Segmentmatrizen 

Als Segmentmatrix (über den entsprechenden Eintrag im Menü Mixed Me- 
thods aufzurufen) wird in MAXQDA eine Zusammenstellung von Codings 
bezeichnet, die nach in Form von Dokumentvariablen hinterlegten Eigen- 
schaften sortiert nebeneinander gestellt werden. Beispielsweise ließen sich die 
Aussagen, die im Rahmen einer Lehrevaluation zur Verbesserung von Veran- 
staltung und Inhalt der Veranstaltung geäußert wurden, danach aufteilen, ob 
die sich äußernden Personen die Abschlussklausur eben dieser Veranstaltung 
bestanden haben oder nicht - vorausgesetzt, die Information bzgl. des Beste- 
hens wurde als Dokumentvariable erfasst. Der Variable Bestanden käme so- 
mit eine Filterfunktion zu. Im Ergebnis, als eigentliche Segmentmatrix, wird 
den Forschenden eine Tabelle präsentiert. In der ersten Spalte findet sich eine 
Liste der ausgewählten Codes, wobei jeder Code und jeder Subcode eine eige- 
ne Zeile erhalten. In den nachfolgenden Spalten werden die Textstellen nach 
gewählten Filtermerkmalen sortiert dargestellt. So würde die zweite Spalte in 
unserem Beispiel die Aussagen all jener Personen enthalten, welche die Klausur 
bestanden haben, während die dritte Spalte alle Aussagen von Personen bün- 
delt, welche die Klausur nicht bestanden haben. Die Codings lassen sich also 
nach Variablenmerkmalen gruppiert darstellen. Diese gemeinsame Darstellung 
ermöglicht beispielsweise einen direkten Vergleich der Aussagen zweier als 
möglicherweise relevant eingeschätzten Gruppen von Merkmalsträger/innen, 
indem qualitative und quantitative Informationen in einer Tabelle zusammen- 
geführt werden. 
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Abb. 10: Ausschnitt einer Segmentmatrix. Dargestellt werden Codings zum Code 
Verbesserungsvorschläge, wobei die Aussagen der Personen, welche die Klausur bestanden 
haben, in der zweiten Spalte und die derjenigen, die die Klausur nicht bestanden haben, in 


der dritten Spalte dargestellt werden. 


Klausur bestanden = 1 


Klausur bestanden <> 1 


Verbesserungs 
vorschläge 


Ich finde, ähm, vielleicht könnte man, kann 
man, also wenn es möglich ist, vielleicht 
kann man diese Übung auf zwei Gruppen 
aufteilen und dann könnte man diese, die 
Fragen, die dann entstehen, eher noch 
durchgehen, als so in diesem großen 
Raum, also in der großen Gruppe ist das 
wahrscheinlich schwierig 

Interviews\B03, 66 


B4: Also es ist jetzt für mich jetzt nen 
bisschen bisschen schwierig, weil ääh, ich 
bin jetzt ein Semester hier und ich weiß 
nicht also es ist ein bisschen, also ich weiß 
jetzt nicht ob ich da was sagen sollte was 
oder kann überhaupt also, wie gesagt, wie 
fands gut die Sachen die die mir nicht 
gefallen haben das sind ja so Sachen die 
mir die jetzt nicht so allgemein verändert 
werden werden müssen, wie zum Beispiel 
das mit dem Tutorium oder was, also da ist 
jetzt oder Vorlesung das ist ja ist ja so, also 
ich hab jetzt nicht so wirklich nen 


B6: (...). An sich haben mir die 
Veranstaltungen eigentlich gut gefallen nur 
der Lärmpegel war manchmal doch etwas 
zuu laut 

I: ja 

B6: dass da dann irgendwie das nächste ma 
ein bisschen 

I: Ja 

B6: entgegengewirkt 

I: Ja 


B6: wird. 
Interviews\B06, 18-24 


B6: Verbesserungswünsche eigentlich nur, 
dass man irgendwie was dann gegen den 
Lärm macht 

Interviews\B06, 32 


Verbesserungsvorschlag. 
Interviews\B04, 34 


I: Damit eben beschäftigt sein und was 


Kreuztabellen 

Prinzipiell folgen die Kreuztabellen (aufzurufen über das Menü Mixed Methods) 
der gleichen Logik wie Segmentmatrizen, d.h. hier werden Codings auf der Grund- 
lage von in Dokumentvariablen vorliegenden Werten gruppiert und dargestellt. 
Allerdings werden in Kreuztabellen nicht die tatsächlichen Dokumentstellen aus- 
gegeben, sondern die Darstellung erfolgt in aggregierter Form: Angezeigt werden 
die absoluten oder wahlweise relativen Häufigkeiten der Vergabe eines bestimm- 
ten Codes in allen Dokumenten, aufgeteilt nach gewählten Variablenmerkmalen. 
Würde das bei den Segmentmatrizen vorgestellte Beispiel als Kreuztabelle darge- 
stellt, so würde in der ersten Spalte der erzeugten Tabelle in jeder Zeile ein Code 
aufgeführt. Die zweite und dritte Spalte wären ebenfalls mit den Merkmalsaus- 
prägungen Bestanden bzw. Nicht bestanden überschrieben. In diesen zweiten und 
dritten Spalten würde nun als Zahlenwert ausgegeben, wie viele Stellen in Doku- 
menten, die dem jeweiligen Kriterium entsprechen, dem entsprechenden Code 
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zugewiesen wurden. Kreuztabellen sind gleichsam eine quantitative Form der 
Segmentmatrizen und erlauben somit ebenfalls einen sehr effizienten Vergleich 
von Gruppen, nun allerdings auf quantifizierter, nicht auf qualitativer Ebene. 


Abb. 11: Kreuztabelle zum Code Verbesserungsvorschläge, Gruppierung der Codehäufigkeiten 
nach der Variable Klausur bestanden. 


z3 Kreuztabellen 


(laus; standen = 


Za mehr mit Praxis verknüpfen 
Zu aufpeppen mit Medien 
=a mehr Tutorien 
SUM 
H N (Dokumente) 
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3 
3 
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1 
1 
1 
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Typologietabellen 

Während Segmentmatrizen und Kreuztabellen auf der Integration von Varia- 
blen und Codes basieren, ermöglichen Typologietabellen (ebenfalls über das 
Menü Mixed Methods aufzurufen) die in einer Tabelle vereinte Gruppierung von 
Variablenwerten und anderen Variablenwerten. Zur Verdeutlichung soll ange- 
nommen werden, dass neben der Tatsache, ob eine befragte Person die Klausur 
bestanden hat oder nicht, auch als Variable erfasst worden wäre, mit welchen 
Strategien sie außerhalb des Besuchs der Veranstaltungen gelernt hat. Dabei ist 
zweitrangig, in welcher Form diese Lernstrategien faktisch in der Variablenta- 
belle festgehalten werden, da die Funktion der Typologietabellen sowohl auf 
numerische als auch auf Stringvariablen anwendbar ist. Für die weitere Ana- 
lyse wäre es nun hilfreich zu wissen, ob eine Häufung zwischen bestimmten 
Lernstrategien und dem Erfolg des Absolvierens der Klausur festgestellt werden 
kann. Genau dieser Frage lässt sich mithilfe der Typologietabelle nachspüren, 
da sie ermöglicht, summarisch darzustellen, mit welchem Erfolg die Nutzer/ 
innen welcher Lernstrategie die Klausur abgeschlossen haben. Dazu werden 
nach dem Aufruf dieser Funktion zunächst aus einer Liste der existierenden Va- 
riablenwerte die hier näher zu betrachtenden ausgewählt, in diesem Fall also die 
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erfassten Lernstrategien. Diese Werte stellen in der späteren Tabelle die Zeilen 
dar, jede gewählte Lernstrategie wird in der resultierenden Tabelle in einer eige- 
nen Zeile ausgegeben. Im nächsten Schritt ist auszuwählen, nach welchen Wer- 
ten die Spaltenaufteilung erfolgen soll. Hier wäre demnach die Variable Klausur 
mit ihren Werten Bestanden und Nicht bestanden auszuwählen. Als Ergebnis 
wird eine Tabelle angezeigt, in der man sofort ersehen kann, welcher Anteil der 
Nutzer/innen eines Lernweges die Klausur bestanden haben oder nicht. Dabei 
werden je nach Datentyp der Variable unterschiedliche Werte mit ausgegeben, 
nämlich wahlweise die absoluten und relativen Häufigkeiten oder, bei nume- 
rischen Variablen, Mittelwert und Standardabweichung. Somit stellt die Typo- 
logietabelle ein Werkzeug dar, mit dessen Hilfe sich Merkmalshäufungen im 
auszuwertenden Material darstellen lassen. Sie ist eine wichtige Hilfe bei der Su- 
che nach Mustern sowie bei der Suche nach unterscheidbaren Typen. 


Abb. 12: Typologietabelle für die Variable Lernstrategien, aufgeteilt nach der Variable Klausur 
bestanden. 


= Typologietabelle 
12 10x 


Lernstrategie: Nicht-Lerner_in, Anzahl (%) 2 (40,0) 
Lernstrategie: Selbstlerner_in, Anzahl (%) 3 (60,0) 1 (20,0) 
Lernstrategie: Veranstaltungslerner_in, Anzahl (%) 2 (40,0) 2 (40,0) 


Konfigurationstabellen 

Die Konfigurationstabelle (Menü Mixed Methods) erlaubt die Beantwortung 
der Frage, wie häufig ausgewählte Codes gemeinsam in einem Dokument ver- 
geben wurden. Dabei meint gemeinsam in diesem Falle nicht gleichzeitig im 
Sinne einer Überschneidung oder nah im Sinne der Nähenanalyse des Code- 
Relations-Browsers, sondern es geht um die Frage, ob die zu untersuchenden 
Codes irgendwo im gleichen Dokument vergeben wurden - also beispielswei- 
se darum, welche Personen sich konkret zu welchen Themen geäußert haben. 
Nach dem Aufruf der Funktion müssen zunächst die Codes ausgewählt wer- 
den, die untersucht werden sollen. Daran anschließend werden zwei tabellari- 
sche Übersichten präsentiert, die Konfigurationstabelle und die Detailansicht. 
In der Konfigurationstabelle wird dargestellt, welche der theoretisch möglichen 
Codekombination im vorliegenden Material tatsächlich vorzufinden sind. Zu- 
sätzlich wird ausgegeben, mit welchen absoluten und relativen Häufigkeiten 
jede der existierenden Kombinationen auftritt. In der Detailansicht wird auf 
Dokumentebene dargestellt, welcher dieser Kombinationen jedes der im Projekt 
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enthaltenen Dokumente zugehörig ist. Als Beispiel ist davon auszugehen, dass 
die im vorigen Absatz bereits erwähnten Lernstrategien im Dokument selbst co- 
diert worden wären, dass also ein Code Lernstrategien mit den Subcodes Lesen, 
Übungsaufgaben bearbeiten, Selbstlernen und Lerngruppe existiert. Werden die 
vier interessierenden Subcodes in Form einer Konfigurationstabelle zusammen- 
geführt, so wird ersichtlich, welche Lernstrategien jede der befragten Personen 
verfolgt hat und wie sich das Verhältnis der verschiedenen möglichen Kombi- 
nationen von Lernstrategien darstellt. Somit eignen sich Konfigurationstabellen 
hervorragend, um nach individuellen Mustern von Inhalten und Eigenschaften 
zu suchen, die in Form von Codes in den Dokumenten erfasst wurden. 


Abb. 13a: Konfigurationstabelle: Es wird dargestellt, dass sieben der 16 theoretisch 
möglichen Codekombinationen (siehe obere rechte Ecke des Fensters) im Material 
vorkommen, um welche es sich handelt und wie häufig sie im gesamten codierten 
Material auftreten. Drei Personen lösen ausschließlich Übungsaufgaben, zwei lesen 
im Selbststudium etc. 


zz] Konfigurationstabelle 


7 (16) Kombinationen 

aae x 
| Lesen | Übungsaufg... | Selbstlernen | Prozent | 

= | 30,00 
20,00 
10,00 
10,00 
10,00 
10,00 
10,00 
100,00 | 


Sfeje Irre iein|o 


M|+|+[.|+.[+|1. |. 


Abb. 13b: Detailansicht der Konfigurationstabelle: Es wird dargestellt, welche 
Merkmalskombination (hier: verfolgte Lernstrategien) in welchem Dokument 
vorzufinden ist. 


B Konfigurationstabelle - Detailansicht t 
Skape] x 


| Dokument... | Übungsaufg... | Selbstlernen | Lerngruppe | Summe | 
= 
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3.5 Summary Grids: Interpretationen und Variablen 
gleichzeitig darstellen 


Die Funktion der Summary Grids ist ebenfalls eine Neuerung in MAXQDA 11. 
Sie ermöglicht in einem zweischrittigen Vorgehen, für jedes einzelne Dokument 
zunächst eigene interpretative und/oder zusammenfassende Texte zu allen 
einem Code zugewiesenen Passagen zu verfassen, um diese selbst verfassten 
Deutungen und Synopsen im nächsten Schritt kumuliert darzustellen und, wenn 
gewünscht, mit in Variablen hinterlegten Informationen zusammenzuführen. 
Um die Zusammenfassungen zu erstellen, muss aus dem Menü Summaries der 
Eintrag Summaries erstellen und editieren ausgewählt werden. Im erscheinend- 
en Fenster ist es nun möglich, durch einen Klick im linken Fensterdrittel (Tabelle 
mit Codes in den Zeilen und Dokumenten in den Spalten) alle einer bestimmten 
Kategorie zugewiesenen Passagen eines Textes im mittleren Fensterteil (Codings) 
anzeigen zu lassen. Im rechten Fensterteil (Summary) kann nun ein freier Text zu 
den angezeigten Codings verfasst werden. Der hier eingegebene Text wird von 
MAXOQDA intern mit den angezeigten Textstellen verbunden. Diese Funktion 
ist demnach ideal dazu geeignet, code- und gleichzeitig dokumentenspezifische 
Zusammenfassungen und Deutungen zu erstellen. Um diese selbst produzierten 
Texte flexibel und in unterschiedlichsten Zusammenstellungen wieder auszu- 
geben, werden im zweiten Schritt Grid-Tabellen erstellt. Diese Funktion wird 
ebenfalls über das Menü Summaries aufgerufen. Eine Grid-Tabelle stellt die ge- 
wählten Summaries gemeinsam mit frei wählbaren Werten aus der Variablenliste 
in einer gemeinsamen Tabelle dar. Beim Erzeugen einer neuen Grid-Tabelle 
muss zunächst ausgewählt werden, ob Variablenwerte mit in die Darstellung 
einbezogen werden sollen und wenn ja, welche. Danach ist auszuwählen, welche 
Interpretations- bzw. Zusammenfassungstexte in die Tabelle aufgenommen wer- 
den sollen. Die Auswahl erfolgt dabei anhand der Codes des Codesystems: Wird 
ein Code ausgewählt, so werden alle Summaries, die im vorherigen Schritt zu 
den Codings der Dokumente erstellt wurden, in die Tabelle eingefügt. Wäre also 
zu jedem Dokument der oben bereits erwähnten fiktiven Lehrevaluation eine 
Zusammenfassung zu den Textstellen erstellt worden, die dem Code Bewertung 
von Veranstaltung und Inhalt zugeordnet wurden, so wäre es nun möglich, all 
diese Zusammenfassungen gemeinsam auszugeben. Dazu müsste bei der Erstel- 
lung des Summary-Grids lediglich der Code Bewertung von Veranstaltung und 
Inhalt ausgewählt werden. Um erläuternde Variablenwerte mit in der Tabelle 
auszugeben, könnten zudem etwa die Variablen Abiturnote oder Fachsemester 
ausgewählt werden, die dann in der Ergebnistabelle neben den Zusammenfas- 
sungen ausgegeben würden. 
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Abb. 14: Erzeugen von Summaries. 


[E Hift da denn die Übung weiter auch? 


isses Interesse am Stoff 
1B3: Also die Übung jetzt dann am Dienstag? der Veranstaltung. Hat sich, wie im Rest des Dokumentes. 
ersichtlich wird, damit klar selbst überrascht. Zudem hat die 
h- 3. Ibefragte Person das Selbstlernen als neue Lernstrategie für 
ae REN! Isich entdeckt, zunächst bedingt durch die ihrer Meinung nach 
R i A N F [zu großen Arbeitsgruppen, nach und nach jedoch vor allem 
1B3: Ähm, nee. Die hilf, die trägt nicht unbedingt dazu bei, das |Iaufgrund des Gefühls, dass das vertiefende Selnbststudium 
Izu verstehen. Es trägt dazu bei, bestimmte Dinge anzuwenden. |\eine besonders effiziente Arbeitsweise darstellt. 
[Aber man versteht es nicht. 


[Sandra [23-26](0) 


[B3: Also meine Einstellung dazu hat sich jetzt mit der Klausur 
[wirklich geändert, weil, ähm, ich das eben selber für mich noch 
[mal durchgegangen bin und jetzt mir bestimmte Zusammenhänge 
laufgehen, und ich denke: Ach, das ist ja doch interessant. Also 
[dass man das, also wie man bestimmte Dinge berechnen kann 
loder wie man auch Sachverhalte ineinander, also miteinander in 

'ergleich stellen kann und so. Und, ähm, ich denke, dass es 
[nicht .. unwichtig ist, das vielleicht zu können später, also .. 
Irgendwie. 


Also da versteht man zwar einen Teil, aber auch nicht so viel. 
[Weil die Arbeitsgruppen auch groß sind. 
[Sandra [42-42](0) 


[B3: Ähm, ähm, ja, der Reader hat mir schon sehr geholfen. 
[Also manche Dinge sind nicht so ganz genau, also so nicht so 
[ganz klar, und die, da findet man aber oft Antworten auf 
landeren Seiten, die zwar jetzt nicht unbedingt dazu gehören. 
Sandra (80-8010) 


3.6 Die Verwendung von Werkzeugen der quantitativen 
Inhaltsanalyse: Worthäufigkeiten und MAXDictio 


Neben den latenten Sinngehalten, die sich mithilfe interpretativ-qualitativer 
Verfahren erschließen lassen, sind mitunter auch quantitative Merkmale der zu 
analysierenden Dokumente von Interesse. So können beispielsweise die Begriffe, 
mit denen befragte Personen bestimmte Gegenstände bezeichnen, einen Rück- 
schluss auf ihre Sichtweise ermöglichen. So macht es etwa einen Unterschied, ob 
Personen im Kontext sozialer Arbeit von Klienten oder Kunden sprechen oder 
ob vornehmlich das Wort Bedürftige verwendet wird. MAXQDA ermöglicht, 
mithilfe der Funktion Worthäufigkeiten einen schnellen und genauen Über- 
blick über den Wortschatz eines oder mehrerer Dokumente zu gewinnen und 
Wortschatzanalysen durchzuführen. Die Funktion wird über das Menü MAX- 
Dictio aufgerufen. Bevor die eigentliche Liste präsentiert wird, können diverse 
Einstellungen vorgenommen werden, die sich auf das Zählergebnis auswirken. 
So kann die Analyse etwa auf einige aktivierte Dokumente oder auch auf die 
Liste der Codings beschränkt werden. Außerdem ist es möglich, eine Stoppliste 
auszuwählen, die Wörter enthält, die bei der Analyse ignoriert werden. So kann 
es beispielsweise oftmals zweckmäßig sein, Konjunktionen und Artikel sowie 
nicht sinntragende Wörter von der Auszählung auszuschließen. Die Liste der 
Worthäufigkeiten selbst enthält schließlich alle in den gewählten Dokumenten 
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vorkommenden Worte, die nicht über die Stoppliste von der Auszählung aus- 
geschlossen wurden. Neben dem Wort selbst werden seine Länge sowie seine 
absolute und relative Häufigkeit innerhalb der Gruppe der für die Analyse ge- 
wählten Dokumente ausgegeben. Wieder ist es möglich, durch einen Klick auf 
den Spaltenkopf nach jeder dieser Spalten zu sortieren, so dass eine alphabeti- 
sche Sortierung der Fundworte ebenso erzeugt werden kann wie eine auf Basis 
der absoluten oder relativen Häufigkeiten. 

Neben dieser tabellarischen Ausgabe ist auch eine stärker visuelle Darstellung 
möglich. Dazu wird nach einem Rechtsklick auf das zu analysierende Dokument 
aus dem erscheinenden Menü der Eintrag Wortwolke gewählt. Das sich öffnen- 
de Fenster stellt alle gezählten Begriffe in alphabetischer Reihenfolge dar, wobei 
die Häufigkeit des jeweiligen Wortes durch seine Größe repräsentiert wird: Je 
größer ein Wort in der Wortwolke erscheint, desto häufiger ist es im analysier- 
ten Dokument. Somit ermöglicht die Wortwolke einen schnellen Einblick in die 
quantitativ dominierenden Begriffe eines Dokumentes. Allerdings ist es auch 
hier erforderlich, eine brauchbare Stoppliste zu erzeugen, was direkt im Fenster 
der Wortwolke über die Schaltfläche Stoppliste editieren geschehen kann. Wort- 
wolken können für einzelne Dokumente erzeugt werden, aber auch für Doku- 
mentgruppen, Dokumentsets oder den gesamten Datenkorpus auf einmal. Dazu 
ist jeweils auf die gewünschte Gruppe zu klicken, also etwa auf den Namen eines 
Sets oder auf den Eintrag Dokumente in der Liste der Dokumente. 

Die Funktionen der Worthäufigkeiten und der Wortwolke stehen letztlich in 
der Tradition der quantitativen Inhaltsanalyse, wenngleich es sich dabei nur um 
einfachste Aspekte dieser Methode handelt. Die quantitative Inhaltsanalyse ist 
eine Verfahrensweise, die mithilfe statistischer Methoden manifeste Inhalte von 
Dokumenten untersucht. Ein übliches Verfahren ist dabei, Kategorien zu bil- 
den, die Begriffe bündeln, denen inhaltlich die gleiche Bedeutung zugeschrieben 
wird. So könnten beispielsweise die Begriffe Angst, Panik, Furcht, Beklemmung, 
Horror und Bammel einer Kategorie mit dem Titel Angst zugeordnet werden. 
Die statistische Auswertung des zu analysierenden Materials erfolgt dann in den 
nächsten Schritten anhand eines Wortvergleichs: Indem Wort für Wort des Ma- 
terials untersucht und mit den Begriffen der Kategorie Angst verglichen wird, 
wird gleichzeitig eine Auszählung vorgenommen, in der festgehalten wird, wie 
häufig die Kategorie Angst in Form der ihr zugeordneten Begriffe in jedem für 
die Analyse gewählten Dokument vorkommt. Am Ende dieses Prozesses liegt 
ein unmittelbarer quantitativer Überblick über die Bedeutung dieser Kategorie 
in jedem untersuchten Dokument vor. Ein weiteres plakatives Beispiel wäre das 
Vorhaben, die politische Ausrichtung eines Dokumentes zu analysieren. Hierfür 
könnten die Kategorien Progressiv und Konservativ angelegt werden, die jeweils 
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typische Begriffe in sich vereinen. Nach erfolgtem Auswertungsdurchlauf kann 
auf Grundlage manifester Inhalte eine Aussage bezüglich der politischen Aus- 
richtung des Dokuments getroffen werden. MAXODA erlaubt mithilfe von 
MAXDictio eine Analyse in genau dieser Vorgehensweise. Den ersten Schritt 
dazu stellt die Definition von Kategorien im Diktionär dar. Das Diktionär stellt 
in MAXQDA die Gesamtheit der Kategorien dar. Jeder Kategorie kann eine 
beliebige Anzahl von Worten zugeordnet werden, Worte können auch mehre- 
ren Kategorien zugehörig sein. Um eine Analyse mit MAXDictio vornehmen 
zu können müssen demnach zunächst die Analysekategorien definiert wer- 
den, wozu der Eintrag Diktionär im Menü MAXDictio aufgerufen wird. Im sich 
öffnenden Fenster können die gewünschten Kategorien angelegt werden. Um 
den Kategorien Worte zuzuordnen, kann auf die bereits beschriebene Liste der 
Worthäufigkeiten zurückgegriffen werden. Um ein Wort aus dieser Liste einer 
Kategorie zuzuordnen, kann es einfach mit der Maus per drag & drop auf die ent- 
sprechende Kategorie gezogen werden. Soll ein Wort hingegen von der Zählung 
ausgeschlossen, also auf die Stoppliste gesetzt werden, so reicht es, in der ersten 
Spalte des Fensters Worthäufigkeiten einen Doppelklick auf den grünen Punkt 
auszuführen. Dieser wandelt sich daraufhin in einen roten Punkt, der anzeigt, 
dass das entsprechende Wort Teil der Stoppliste ist. Um nun die Auszählung zu 
starten wird die Funktion MAXDictio-Codiertool aus dem Menü MAXDictio auf- 
gerufen. Als Codieren wird in diesem Kontext das Zählen der Häufigkeiten des 
Vorkommens der Kategorien bezeichnet, wobei die im Diktionär gesammelten 
Wörter als Indikatoren verwendet werden. Als Ergebnis wird eine Tabelle aus- 
gegeben, die für jedes Dokument die Anzahl des Vorkommens jeder definierten 
Kategorie darstellt. Auch ist es möglich, das Dokument mithilfe von Codes wei- 
ter zu unterteilen, so dass sich die Auswertung nicht immer auf das gesamte Do- 
kument beziehen muss, sondern auch feinere Codiereinheiten definiert werden 
können. Zudem ist es möglich, die Zählergebnisse direkt in Dokumentvariablen 
zu transformieren, wodurch sich wieder das gesamte Spektrum der oben be- 
schriebenen Möglichkeiten zur Arbeit mit Variablen eröffnet. 

Der Erstellung eines fundierten Diktionärs sowie einer guten Stoppliste 
kommt in dieser Forschungsmethodik eine entscheidende Rolle zu, da sie 
Analyseinstrumente bilden, die automatisch angewendet werden. Dabei 
bleibt ein gewisses Restrisiko, dass die Zählung nicht korrekt ist, etwa weil 
Wortteile als ganze Worte ausgewertet werden oder Begriffe mehrdeutig sind. 
Um die manuelle Überprüfung zu ermöglichen, kann MAXDictio eine Vali- 
dierungsdatei erzeugen, welche den analysierten Text enthält und in der alle 
Zählungen kenntlich gemacht wurden, so dass die Grundlage der Auszählung 
transparent wird. 
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3.7 Forscher/innentriangulation: Intercoder-Übereinstimmung 


Ein wichtiger Schritt zur Sicherung der Güte qualitativer Forschung, aber auch 
zur Validierung und Verbesserung der Forschungsergebnisse, ist der Ansatz, 
die Intersubjektivität des analytischen Vorgehens sicherzustellen (vgl. u.a. Seale 
2007, Steinke 1999). Viele Möglichkeiten bietet hierzu die Arbeit in einem Team 
von Forscher/innen, wodurch unter anderem die von Norman Denzin unter 
dem Schlagwort Forschertriangulation (Denzin 1978) beschriebene Vorgehens- 
weise nutzbar gemacht wird. Von besonderer Bedeutung kann dabei das Ver- 
fahren der Bestimmung der Intercoder-Übereinstimmung sein. In MAXQDA ist 
es möglich, die Codierungen, die zwei Forscher/innen unabhängig voneinander 
im gleichen Dokument vorgenommen haben, miteinander zu vergleichen. Ein 
wichtiges Ziel kann dabei sein, unterschiedliche Verständnisse von Dokument 
und/oder Code aufzudecken, die ggf. eine Redefinition und Verbesserung des 
Codesystems nach sich ziehen und zu zuverlässiger codierten - und damit inter- 
pretiertem, verstandenen - Material führen können. Dazu codieren mindestens 
zwei Personen unabhängig voneinander das gleiche Dokument, das zu diesem 
Zwecke zweimal in MAXQDA eingelesen wird und unterschiedlich benannt 
werden sollte, mit dem gleichen Codesystem. Anschließend wird über das Menü 
Analyse die Funktion Intercoder-Übereinstimmung aufgerufen. Im nun erschei- 
nenden Dialog wird ausgewählt, welche Dokumente miteinander verglichen 
werden sollen. Zudem wird eingestellt, auf welche Übereinstimmung hin die 
Dokumente untersucht werden sollen. Zur Verfügung stehen hier drei Optio- 
nen. Vorhandensein des Codes im Dokument untersucht, ob in beiden Dokumen- 
ten die gleichen Codes angewendet wurden. Dabei spielt es keine Rolle, wie oft 
oder an welcher Stelle die Codes vergeben wurden, allein das Vorhandensein 
des Codes ist entscheidend. Daneben ist es möglich, nach der Häufigkeit der 
Codes im Dokument zu untersuchen. Hier wird auch berücksichtigt, ob beide 
Codierer/innen den fraglichen Code jeweils gleich häufig im Dokument verge- 
ben haben, wobei die tatsächliche Position keine Rolle spielt. Schließlich ist es 
auch möglich, die Übereinstimmung der Segmente in % zu untersuchen. Diese 
Analyseeinstellung vergleicht, ob tatsächlich beide Codierende die identische 
Dokumentstelle dem gleichen Code zugewiesen haben. Natürlich wäre ein 100 
prozentige Übereinstimmung eher zufällig, zumindest, wenn es sich um Material 
handelt, das in einigermaßen freier Form vorliegt. Deshalb ist es möglich, einen 
Prozentwert einzustellen, der als Grenze für gültige Übereinstimmungen fun- 
giert. Er gibt an, welcher Anteil eines Codings mit jenem der anderen Codiererin/ 
des anderen Codierers übereinstimmen muss, um als übereinstimmend gewertet 
zu werden. 
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Neben der Möglichkeit, die Codierarbeit zweier verschiedener Personen mit- 
einander zu vergleichen, kann diese Funktion auch dazu eingesetzt werden, die 
Intracoder-Übereinstimmung zu untersuchen. Dabei handelt es sich gewisserma- 
ßen um die Überprüfung der persönlichen Codierzuverlässigkeit. Dieses Verfahren 
kann sehr sinnvoll sein, um sicherzustellen, dass auch am Ende des Codierprozesses 
die Codes noch in der gleichen Weise vergeben - und damit verstanden - werden, 
wie am Anfang. Um die Intracoder-Übereinstimmung zu überprüfen, wird ein Do- 
kument, das man in einer früheren Projektphase bereits codiert hat, erneut codiert, 
und zwar ohne sich die ursprünglichen Codierungen vorher anzusehen. Der weitere 
Verlaufist dann identisch mit der beschriebenen Vorgehensweise zur Untersuchung 
der Intercoder-Übereinstimmung. Der einzige Unterschied liegt lediglich darin, 
dass als Dokumente, die verglichen werden sollen, die früher und die später von der 
gleichen Person codierten Versionen des identischen Dokuments gewählt werden. 

Die Überprüfung der Intercoder-Übereinstimmung stellt eine wichtige Vorge- 
hensweise der Triangulation dar, da auch hier eine zweite Perspektive auf das Daten- 
material eingenommen wird. Auch der Beitrag der Intracoder-Übereinstimmung ist 
nicht zu unterschätzen: Die Veränderungen, welche die Sicht auf das Forschungsthe- 
ma, die Forschungsfrage, die befragten Personen etc. während des Forschungspro- 
zesses erfahren, sind teilweise nicht unerheblich. Die Überprüfung der Konsistenz 
des Verständnisses und der praktischen Codierarbeit leistet somit ebenfalls einen 
direkten Beitrag zu Erhöhung der Qualität und hilft, ein sich verschiebendes Refe- 
renz- bzw. Deutungssystem zu erkennen und entsprechend zu reagieren. 


4. Der schnelle Import gemischter Datenarten: 
Dokumente in Tabellen 


Bisher wurde für die Integration quantitativer Daten in MAXQDA der Weg be- 
schrieben, die betreffenden Daten zusätzlich zu den qualitativen separat in MAX- 
QDA einzugeben oder mithilfe des Variablenimports einzulesen. In der Praxis 
gibt es jedoch auch einige Situationen, in denen die beiden Datenarten direkt ge- 
meinsam in einer Datei vorliegen. Dies ist beispielsweise dann der Fall, wenn die 
Daten mithilfe eines Online-Datenerhebungstools oder unterstützt durch CATI-/ 
CAPI-Software erhoben wurden. Aber auch nach der Eingabe oder Digitalisie- 
rung klassischer Papierfragebögen erhält man üblicherweise eine einzige Datenta- 
belle. Dabei ist der Aufbau dieser Tabellen in der Regel gleich und orientiert sich 
an den Anforderungen von Software zur statistischen Datenanalyse, d.h. jede Zei- 
le der Tabelle enthält einen Fall, jede Spalte steht für eine Frage, wobei sich Spalten 
mit standardisierten und nicht standardisierten Daten häufig abwechseln. Eine 
solche Urliste kann nach minimaler Vorbereitung direkt in MAXQDA eingelesen 
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werden, wobei gleichzeitig die unterschiedlichen Datenarten nach den Vorgaben 
der Forschenden getrennt und entweder als Teil eines Dokuments oder als Vari- 
ablenwerte eingefügt werden, wobei auch hier eine Zeile als ein Fall gehandhabt 
wird. Beim Import werden für jede Zeile sämtliche Daten, die für die Übertragung 
in die Liste der Dokumente vorgesehen wurden - in der Regel die nicht standar- 
disierten Daten - zusammengefasst, so dass je Zeile ein Dokument in der Liste 
der Dokumente entsteht, das all diese nicht standardisierten Daten enthält. Da- 
bei wird für jede einzelne Zelle der Urliste, also letztlich für jeweils eine kom- 
plette Antwort auf eine einzelne Frage, ein eigener Absatz im Dokument erzeugt. 
Enthielte eine einzulesende Urliste also drei offene Fragen, so würde in MAXQ- 
DA jedes Dokument aus drei Absätzen bestehen. In der Urliste enthält in der Re- 
gel die erste Zeile als Spaltenüberschrift den Wortlaut der Fragen oder auch eine 
Fragenbezeichnung in Form eines Kürzels. MAXQDA erzeugt aus diesen Spal- 
tenüberschriften der nicht standardisierten Daten zusätzlich automatisch Codes, 
denen als Codenamen eben diese Überschriften zugewiesen werden. Gleichzeitig 
werden alle Daten, die sich in der jeweiligen Spalte befanden, also die Antworten 
auf die entsprechende Frage darstellen, diesem neu erzeugten Code zugewiesen. 
So wird es möglich, direkt nach dem Import der Daten und ohne weiter manuelle 
Vorbereitung schnell auf einer explorativen Ebene mit der Analyse der Daten zu 
beginnen, beispielsweise, indem alle Antworten auf eine bestimmte Frage aufgeru- 
fen werden. Doch diese Funktion bringt noch mehr Komfort mit sich: Jene Daten, 
die nicht als auszuwertender Text, sondern als Variablenwerte zur Verfügung ste- 
hen sollen, werden automatisch in die Dokumentvariablen überführt. Dabei wird 
die Spaltenüberschrift, also der Fragewortlaut oder das Kürzel, zum Variablen- 
namen und die von den befragten Personen angegebenen Daten werden direkt 
als Werte hinterlegt. Dadurch ergeben sich direkt nach dem Einlesen vielfältige 
Analysemöglichkeiten, viele der oben dargestellten Funktionen sind unmittelbar 
nutzbar. So können beispielsweise direkt Statistiken erzeugt werden, es können 
Kreuztabellen und Segmentmatrizen erzeugt werden oder es können mithilfe der 
Aktivierung via Dokumentvariablen die Antworten von Befragten mit bestimmten 
Merkmalen aufgerufen werden. Allerdings handelt es sich dabei in viele Fällen erst 
um den Beginn der Analyse, da die Codierung ausschließlich formal und nicht 
nach tatsächlichen inhaltlichen Kriterien erfolgte, eine interpretierende Bearbei- 
tung des Materials also häufig noch notwendig sein wird. Insgesamt eröffnet diese 
Vorgehensweise mit vergleichsweise geringem Aufwand den Weg zu ernsthaften 
mixed method-Analysen der erhobenen Daten, in denen nicht, wie leider so oft, 
einer der beiden Datenarten eine viel zu geringe Beachtung zuteilwird. 

Um die Daten in MAXQDA einzulesen, muss zuerst mit der rechten Maus- 
taste auf den Eintrag Dokumente in der Liste der Dokumente geklickt werden. 
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Im sich öffnenden Menü wird dann der Punkt Import von Dokumenten aus 
Tabelle aufgerufen. Im nächsten erscheinenden Fenster wird noch einmal erläu- 
tert, wie die Daten für den Import vorzubereiten sind. Die einzulesende Tabelle 
muss eine erste Spalte mit der Überschrift Dokumentgruppe enthalten, die in 
den Zellen darunter einen beliebigen Wert enthält. Hier wird definiert, welcher 
Dokumentgruppe der Datensatz der jeweiligen Zeile zugeordnet wird. Sollte die 
Dokumentgruppe nicht existieren, so wird sie erzeugt. Es können auch alle Do- 
kumente in die gleiche Dokumentgruppe eingeordnet werden. Die zweite Spalte 
muss mit Dokumentname überschrieben werden. Der Wert, der hier hinterlegt 
wird, wird nach dem Import als Dokumentname in der Liste der Dokumente 
erscheinen. Es hat sich bewährt, hier einfach das Kürzel des Datensatzes, das 
ihm bei der Dateneingabe, während der Erhebung oder durch das Surveytool 
zugewiesen wurde, beizubehalten, nicht zuletzt, um die Verbindung zwischen 
den Dateien aufrecht zu erhalten. Die nachfolgenden Spalten enthalten schließ- 
lich die erhobenen Daten. Um MAXQDA mitzuteilen, welche der Spalten Wer- 
te enthalten, die als Variablen gespeichert werden sollen, müssen nur noch die 
Überschriften der entsprechenden Spalte bearbeitet werden: Jede Spalte, deren 
Überschrift mit einem $-Symbol beginnt, wird von MAXQDA als Variable 
behandelt. Um etwa die Werte der Spalte Geburtsjahr in die Variablenliste zu 
überführen würde die Überschrift der Spalte so bearbeitet, dass sie $Geburtsjahr 
heißt. Dadurch wird beim Import eine neue Variable des Namens Geburtsjahr 
erzeugt und die Werte werden dieser Variable zugewiesen. Alle übrigen Spal- 
ten werden als zu analysierender Text angesehen und als Absatz in das erzeugte 
Dokument eingefügt. 


Abb. 15a: Ausschnitt einer fertig vorbereiteten Urliste: Die Spalten Dokumentgruppe und 
Dokumentname existieren und sind gefüllt und die Überschriften der Spalten, deren Inhalt 
nicht als eigentlicher, zu codierender Text, sondern als Variablenwerte in MAXQDA eingefügt 
werden soll, beginnen mit einem $-Symbol. 


A B [a D E F G H 7 K 
ı Dokumentari DokumentnameBitte beschre Beschreiben Bitte beschre Nun zur konk $In welchem $Bitte geben Swaiche Not $Hatten Sie I$In welchem $wie bawan 
Survey 6 Montag - VoiDen VeranstzIch hege keir Ich habe mic 4 F ON 7 
Survey 7 Die Woche bıFür Montag zIch war nie sIn der Vorles 1986 F 
Survey 8 Montag nachmittels der Ü Da Statistik ı Manchmal fie 1987 F 
Survey 9 Montag morgIch gehe zu (Zu Beginn de Eigentlich ga 1984 F 
Survey 10 Montag 14-1 vor der vorle Am anfang fzganz gut 1985 F 
Survey 11 Vor jahreswe Anfang auch Vor Beginn s(Meist Kopfsc 1980 F 
Survey 12 montags gehich schreibe kein gutes geoft überforde 1986 F 
Survey 13 bis zum januiich hangel miehrlich gesag das tutorium 1986 F 
Survey 14 Mo: Vorlesun Tutorium, eig ganz zu BegiiVorlesung: ic 1981 F 
Survey 15 Die Statitikw Ich höre mir Ich war dem Die Vorlesung 1987 F 
Survey 16 montag morg tutorium besızunächst wa in den vorles 1985 F 
Survey 17 Montag gehe selber die kajetwas ungut: Vorlesung: e: 1986 F 
Survey 18 Montag: Sta‘1.: Ich höre Ich konnte mIn der Vorles 1987 F 
Survey 19 Montag mittzMir reicht dieIch mochte ilDie Vorlesung 1987 F 
Survey 20 Montag MittHauptsächlic Anfangs hateIn der Vorleu 1985 F 
Survey 21 Montag MorgNach der Vor Nein Statistik Gut. Teilweis 1986 F 
22 Montag 14.0idurch Übung Anfangs hatt Vorlesung: m 1986 F 
23 Meine StatisiIch erarbeite Ich finde, da Vorlesung: E: 1986 F 
24 Montag Vorle Indem ich de Ja ein bissch Meistens gar 1987 F 
25 Meine typisclVorlesung un Das Thema aAlle Veranstz 1986 M 
26 Eine typische Durch Nachb Durch Erzählt Allgemein set 1985 F 
27 Vor der Stati” #NAME? Ich hatte etiIch habe mic 1983 M 


28 Montags Vorlindem ich dieMeine gefühlıMit Hilfe der ` 1985 F 
29 Meine Statis{Also zum Eint Zu Beginn, mJa in der Vorl 1986 F 
30 Ich besuche siehe oben Zu Beginn eher Angst und 1986 F 
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Abb. 15b: Ergebnis des Imports der vorbereiteten Urliste: Aus jeder Zeile der Urliste wurde 
ein eigenes Dokument, in dem jede Zelle als Absatz erscheint. Die als Variablen markierten 
Werte ($-Symbol) wurden entsprechend in die Variablenliste eingefügt. 


Projekt Bearbeiten Dokumente Codes Summarys Memos Variablen Analyse MixedMethods VisualTools Fenster MAXDictio Symbolleisten ? 
i Blulutjemorzanden u 


1. Montag - Vorlesung Dienstag- Übung Vor der Klausur unverstandenes nacharbeiten. 

2 Den Veranstaltungsstoff (sofern nicht in der VL verstanden, eigen ich mir durch das Lesen des "Bortz" an, bzw ducrh treffen mit 
meiner Lemgruppe. 

3 Ich hege keine Gefühle gegenüber der Statistik und tat dies auch früher nie! 

4 Ich habe mich in der VL oft darüber geärgert, dass der Geräuschpegel extrem hoch war und die Vorlesung, auch in der ersten 
Reihe, dadurch schlecht verständlich war. Im nächsten Semester sollte nachhaltiger darauf hingewiesen werden, dass es sich 
nicht um eine Pfichtveranstaltung handelt. Wer nicht zuhören will soll gehen - die Schulzeit ist vorbei! 


Dokumentvariablen 
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5. Resümee: Triangulation mithilfe von QDA-Software 


Die Verbindung qualitativer und quantitativer Daten und Forschungslogi- 
ken entwickelt sich unabhängig von der konkreten Bezeichnung der jeweils 
angewendeten Vorgehensweise mehr und mehr zum Standard sozialwissen- 
schaftlicher Forschung. Moderne QDA-Software kann hier auf viele Weisen 
unterstützen. Durch die Möglichkeit, Daten unterschiedlicher Art gemeinsam 
zu betrachten, gleichzeitig auszuwerten und auf unterschiedlichste Weise auf 
einander zu beziehen eröffnet sich ein weites Spektrum analytischer Möglich- 
keiten, das vor Zeiten der computerunterstützten Datenanalyse fast undenkbar 
war. Arbeitsschritte, die manuell einen enormen Zeitaufwand bedeutet hätten, 
sind mithilfe des Computers in wenigen Augenblicken abgeschlossen - man 
denke etwa an die sich durch die Aktivierung via Dokumentvariablen oder 
durch Joint Displays ergebenden Möglichkeiten und die Arbeit, die eine ma- 
nuelle Darstellung bedeuten würde. Von gleicher Wichtigkeit ist die Öffnung 
der Software für die Interaktion mit anderen, spezialisierten Programmen, 
hier vor allem mit Werkzeugen zur statistischen Datenanalyse. In der Gesamt- 
heit betrachtet ist es für die Forschenden heute auf technischer Ebene leich- 
ter als jemals zuvor, echte Mixed Methods-Analysen durchzuführen, die über 
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das bloße Nebeneinanderstellen unterschiedlicher Daten(-arten) hinausgehen. 
Gleichzeitig wird die Erfordernis fundierter methodologischer Kenntnisse im- 
mer dringlicher, da Forschende nicht nur in beiden Analysearten bewandert 
sein müssen, sondern auch die durch die Triangulation entstehende Komple- 
xität zu bewältigen haben. Schließlich ist nicht alles, was sich transformieren, 
mixen, triangulieren oder integrieren lässt, auch wirklich sinnvoll. Dabei ist 
nicht aus den Augen zu verlieren, dass es sich bei diesen Ansätzen nicht um 
Selbstzwecke handelt, sondern dass eine geschickte, auf die Besonderheiten 
der jeweiligen Untersuchung zugeschnittene Verbindung der Methodenfamili- 
en tatsächlich einen enormen Zugewinn an Qualität und Güte, Verlässlichkeit 
und Glaubwürdigkeit mit sich bringen kann (siehe etwa Kelle 2008, Flick 2011, 
Mayring 2001). 
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“Are you good at reading?” 
Zur Diagnosekompetenz von 
Englischlehrkräften 


Laura Armbrust 


Das hier beschriebene Dissertationsvorhaben untersucht empirisch die Diagnose- 
kompetenz von Englischlehrkräften der Sekundarstufe I hinsichtlich der Fertigkeit 
Lesen. Grundlage der Datenerhebung bilden leitfadengestützte Experteninterviews. 
Der vorliegende Beitrag fokussiert insbesondere die Auswertungsmethode der 
Qualitativen Inhaltsanalyse. Zunächst wird über einen theoretischen Hintergrund in 
das Thema des Forschungsprojekts eingeführt. Hieran schließen sich Forschungs- 
design sowie Erläuterungen zur Datenerhebungsphase an. Ausführlich werden im 
Anschluss Methode und Methodik der Zusammenfassenden Inhaltsanalyse und 
Inhaltlich Strukturierender Inhaltsanalyse veranschaulicht und die Vorzüge einer 
computerunterstützten Auswertung mithilfe von MAXQDA herausgearbeitet. 


1. Was wir über das Diagnostizieren von Lesekompetenz 
wissen 


Schon in den 1990er Jahren unterstrich Ingenkamp (1991: 780) die Relevanz von 
Diagnosekompetenz: „Ein Bildungswesen ohne entwickelte Pädagogische Dia- 
gnostik ist ein lernunfähiges System.“ Dass sich hieran auch gut 20 Jahre später 
nichts geändert hat, zeigen beispielsweise Paradies et al. (2011: 10), die beklagen, 
dass aufgrund einer unzureichenden Diagnosekompetenz auf Seiten der Lehrkräf- 
te Lernschwierigkeiten der Schülerinnen und Schüler häufig unerkannt blieben. 
Die Forderung nach einer Verbesserung der Diagnosekompetenz von Lehrkräften 
ist spätestens seit dem unbefriedigenden Abschneiden deutscher Schülerinnen und 
Schüler in den (internationalen) Vergleichsstudien PISA, TIMSS, oder IGLU in das 
Bewusstsein der Öffentlichkeit und in den Fokus bildungspolitischer Diskussio- 
nen gerückt. So wurden Hauptschullehrkräfte in PISA 2001 gebeten, sogenannte 
„schwache Leser“ (vgl. Hesse/Latzko 2011: 14) zu identifizieren. Die Einschätzun- 
gen der Lehrkräfte wurden anschließend mit dem tatsächlichen Abschneiden der 
Schülerinnen und Schüler im Bereich Lesekompetenz verglichen. Knapp 90% der- 
jenigen Lernenden, die im Test als schwache Leser eingestuft wurden, konnten von 
den Lehrkräften vorab nicht als solche identifiziert werden (vgl. ibid.: 14f.). 

Die Kultusministerkonferenz der Länder (KMK) reagierte 2003 und 2004 
auf das enttäuschende Ergebnis der Vergleichsstudien mit der Abfassung von 
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Bildungsstandards für die Fächer Mathematik, Deutsch und die erste Fremd- 
sprache (Englisch/Französisch). Darüber hinaus wurden Standards für die 
Lehreraus- und -fortbildung formuliert. Diese beziehen explizit auch die Diag- 
nosekompetenz mit ein: „Lehrerinnen und Lehrer üben ihre Beurteilungs- und 
Beratungsaufgabe im Unterricht und bei der Vergabe von Berechtigungen für 
Ausbildungs- und Berufswege kompetent, gerecht und verantwortungsbewusst 
aus. Dafür sind hohe pädagogisch-psychologische und diagnostische Kompe- 
tenzen von Lehrkräften erforderlich.“ (KMK 2004: 3). Diese diagnostischen 
Kompetenzen gilt es, differenziert zu betrachten und gezielt einzusetzen, sodass 
Lehrkräfte gegenstandsangemessen urteilen und verlässlich diagnostizieren (vgl. 
KMK 2004, Schrader 2009). Im Einzelnen bedeutet dies, dass Lehrkräfte in der 
Lage sein sollten, auf das Leseverständnis als Solches zu achten und bei dessen 
Diagnose zum Beispiel mögliche fehlende grammatisch-lexikalische Kompeten- 
zen der Schülerinnen und Schüler außer Acht zu lassen. Diagnosekompetenz 
wird damit als herausfordernder und wichtiger Bestandteil der unterrichtlichen 
Tuns der Lehrkräfte anerkannt. 

Nicht nur auf bildungspolitischer Ebene ist die Diagnosekompetenz explizit 
in die Lehrerbildung aufgenommen worden (vgl. KMK 2004), zahlreiche Stu- 
dien beschäftigen sich ebenfalls mit diesem Thema. Sie untersuchen in erster 
Linie die Urteilsgenauigkeit von Lehrkräften in unterschiedlichen Fachdiszip- 
linen (u.a. Spinath 2005, Südkamp et al. 2008, McElvany et al. 2009) und brin- 
gen durchaus unterschiedliche Ergebnisse hervor. So untersuchte beispielsweise 
Spinath (2005) eine Gruppe von 723 Grundschulkindern in Bezug auf ihre In- 
telligenzkennwerte sowie Selbsteinschätzungen hinsichtlich ihrer Fähigkeits- 
wahrnehmung, Lernmotivation und Schulangst. Diese Daten wurden mit den 
Aussagen von 43 Klassenlehrkräften korreliert, die ebenfalls die Schülermerk- 
male eingeschätzt hatten. Das Ergebnis der Studie wies auf eine geringe Akku- 
ratheit der Einschätzungen der Lehrkräfte hinsichtlich der Schülermerkmale hin 
(vgl. Spinath 2005: 85ff.). Die Studie von Südkamp et al. (2008) untersuchte die 
diagnostische Kompetenz von 24 Lehramtsstudierenden, die mittels Computer- 
simulation eines Klassenzimmers Leistungen von Schülerinnen und Schülern 
möglichst exakt einschätzen sollten. Bei zwei zeitlich versetzten Messzeitpunk- 
ten erwiesen sich die Einschätzungen der Lehramtsstudierenden als „recht gute 
diagnostische Leistungen“ (Südkamp et al. 2008: 95). Diese experimentelle Un- 
tersuchung bildet jedoch auf Grund des eingesetzten simulierten Klassenraums 
keine komplex ablaufenden Prozesse der Unterrichtswirklichkeit ab. 

Zentrales Ergebnis der Studie von McElvany et al. (2009), in der 116 Lehr- 
kräfte und 48 Klassen untersucht wurden, ist eine schwache bis mittelmäßig aus- 
geprägte Diagnosekompetenz der Lehrkräfte mit Tendenz zur Unterschätzung 
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der Schülerleistungen. Lehrkräfte wurden hierfür gebeten, Schülerleistungen 
und Aufgabenschwierigkeiten anhand von Lernmedien mit Abbildungen einzu- 
schätzen. Die Ergebnisse zeigen Schwierigkeiten für die Lehrpraxis aus folgen- 
dem Grund: Das Wissen der Lehrkräfte hinsichtlich der Bedeutung von Text und 
Abbildung ist nicht hinreichend. Dies ist insbesondere vor dem Hintergrund der 
Lesekompetenzförderung bemerkenswert, da Bilder als Verstehenshilfe im Lese- 
prozess gesehen werden können (vgl. u.a. BMBF 2007: 24ff.). 

Während die bisher dargestellten Studien in ihren Vorgehensweisen dem 
quantitativen Paradigma zuzuordnen sind, ist nur eine qualitativ angelegte 
Studie bekannt, welche sich der Frage nach Beurteilerübereinstimmungen im 
Kontext des Englischunterrichts der Grundschule widmet (Hochstetter 2011). 
Hierzu wurden Beobachtungsbögen eingesetzt, um die Fertigkeit Sprechen bei 
Grundschulkindern zu diagnostizieren. Hochstetter attestiert den beteiligten 
Lehrkräften eine zufriedenstellende Übereinstimmung der jeweiligen Einschät- 
zungen in Bezug auf die Schülerleistungen. Im Gegensatz dazu beschreibt sie 
jedoch auch Unsicherheiten der Befragten insbesondere hinsichtlich der vorläu- 
figen Diagnose von Schülerleistungen, die nicht für die Notengewinnung bzw. 
zur Leistungsmessung dienen (vgl. Hochstetter 2011: 244f.). 

Durch Studien bislang nicht in den Blick genommen wurden hingegen Di- 
agnosekompetenzen bezüglich der rezeptiven Fertigkeiten, insbesondere des 
Lesens, das im Sinne einer gesellschaftlichen Teilhabe an Bildung als Schlüssel- 
kompetenz gelten kann. In PISA 2000 und 2009 lagen die deutschsprachigen 
Leseleistungen der Schülerinnen und Schüler in Deutschland unter dem OECD- 
Durchschnitt und damit hinter den Erwartungen der Bildungspolitik. Ebenso 
zeigten die DESI-Studie 2006 und der Ländervergleich 2009 deutliche Schwächen 
in der englischen Lesekompetenzleistung deutscher Schülerinnen und Schüler 
(vgl. Harsch et al. 2006, Köller et al. 2010). Die ungenügende Leseleistung beider 
Schulstufen in den Fächern Deutsch und Englisch v.a. in den nicht-gymnasialen 
Schulformen lässt deutlich werden, dass die Förderung von Lesekompetenz und 
damit einhergehend die Fähigkeit der Lehrkräfte, Lesekompetenz exakt zu diag- 
nostizieren, als ein wichtiges Desiderat angesehen werden muss. 

Zweifelsohne kann nicht nur alleine der Deutschunterricht gefordert sein, 
sondern es muss vielmehr Aufgabe aller Fächer sein, Lesekompetenz zu för- 
dern, da sie als fächerübergreifende Schlüsselkompetenz gilt (vgl. Spinner 2004: 
136 u. 138). Naheliegend ist die Fokussierung der Lesekompetenz auch in den 
Fremdsprachen, insbesondere im Fach Englisch. In diesem Fach wird viel gele- 
sen und mit Texten gearbeitet, sodass die Schülerinnen und Schüler über eine 
entsprechende Lesekompetenz verfügen müssen. Es liegt also nahe, der Lese- 
kompetenzförderung verstärkt Beachtung zu schenken, da ab der Sekundarstufe 
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I insbesondere die Schriftsprache als wichtigste Kompetenz in allen Fächern 
gefordert wird. Um kompetente Leserinnen und Leser auszubilden, bedarf es 
einer sachgerechten Diagnose von Seiten der Lehrkräfte (vgl. Schrader 2009). 
Lesekompetenzdiagnose und eine sich anschließende Förderung sind entschei- 
dende Faktoren im Unterricht, die sich nach Einführung des frühen Fremd- 
sprachenlernens in der Primarstufe in allen Bundesländern (2003) auch in den 
ersten beiden Jahren der Sekundarstufe I von Bedeutung ist. Die Schülerinnen 
und Schüler haben bereits erste Kenntnisse in der Fremdsprache während der 
Primarstufenzeit erworben, die sich jedoch weitestgehend auf die Mündlichkeit 
konzentrieren. In den vergangenen Jahren verlagerte sich der Fokus von der rei- 
nen Mündlichkeit hin zu einem auch an der Schriftsprache orientierten Ansatz, 
sodass zu Beginn der Sekundarstufe I auf erste Kenntnisse in allen Kompetenz- 
bereichen der Fremdsprache zurückgegriffen werden kann (vgl. u.a. Hessisches 
Kultusministerium 0.A.: 11). Dieses Potenzial gilt es für den jeweiligen Englisch- 
unterricht zu Beginn der Sekundarstufe I zu nutzen und im Sinne einer gegen- 
standsangemessenen Diagnose von Seiten der Lehrkräfte aktiv in pädagogische 
Überlegungen mit einzubeziehen. Daher müssen oftmals unbewusst ablaufende 
Prozesse der Diagnose (vgl. Hochstetter 2011) in das Bewusstsein der Lehrkräf- 
te gerückt werden, um einen bedarfsgerechten und motivierenden englischen 
Leseunterricht gestalten zu können, Kompetenzzuwächse zu ermöglichen bzw. 
Defizite frühzeitig zu erkennen und auszugleichen. So ergibt sich im Sinne Hal- 
lets (2006: 101) ein Ziel, „welches letztlich eine diagnostische Kompetenz bei 
Lehrer/innen sein [muss], die sie in die Lage versetzt, routinemäßig Diagnosein- 
strumente selbst zu entwickeln und diese bedarfsorientiert einzusetzen.“ 

Vor diesem Hintergrund liegt der Fokus des hier beschriebenen Dissertati- 
onsvorhaben auf der Erforschung der Diagnosekompetenz bei Englischlehr- 
kräften der Sekundarstufe I in Bezug auf fremdsprachliches Lesen. Dabei stehen 
folgende Fragen im Mittelpunkt: 


1. Wie diagnostizieren Lehrkräfte fremdsprachliche Lesekompetenz und welche 
Methoden wenden sie dabei an? 

2. Welche Bedingungsfaktoren der Diagnosekompetenz (Evaluierungskompe- 
tenz, Kompetenzwissen, Bedingungswissen, technologisches Wissen oder di- 
agnostische Methodenkompetenz, Änderungswissen und Vergleichswissen) 
zeichnen die Lehrkräfte im Bereich fremdsprachliche Lesekompetenz aus 
und wie stellen sich diese dar? 

3. Welcher Maßnahmen (z. B. Fortbildung zum Einsatz von Diagnoseinstru- 
menten) bedarf es, um Lehrkräfte im Bereich der Lesekompetenzdiagnose zu 
professionalisieren? 
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2. Forschungsdesign 


Dem Kriterium der Gegenstandsangemessenheit folgend wurden zur Datener- 
hebung leitfadengestützte Experteninterviews eingesetzt (vgl. u.a. Bogner et al. 
2005, Schrader 2009: 239, Gläser/Laudel 2010, Meuser/Nagel 2010, Kruse 2011: 
255ff.). Diese haben sich mit Blick auf die Fragestellung als zielführend erwiesen, 
um das exklusive (Erfahrungs-) Wissen der Lehrkräfte hinsichtlich der Diagno- 
se von fremdsprachiger Lesekompetenz zu eruieren. Für die hier beschriebene 
Arbeit relevante Typologien des Experteninterviews beinhalten das ‚systemati- 
sierende‘ und ‚theoriegenerierende‘ Interview als „eine anwendungsbezogene 
Variante von Leitfadeninterviews“ (Kruse 2011: 57). Im Vordergrund des syste- 
matisierenden Experteninterviews steht „das aus der Praxis gewonnene, reflexiv 
verfügbare und spontan kommunizierbare Handlungs- und Erfahrungswissen“ 
(Bogner/Menz 2005: 37). Das theoriegenerierende Experteninterview hingegen 
strebt eine analytische Rekonstruktion von implizitem und damit unbewusstem 
Deutungswissen sowie Handlungsroutinen der Lehrkräfte an. Beiden Dimen- 
sionen gemein ist deren Bestreben nach thematischer Vergleichbarkeit der Ex- 
pertenäußerungen. Ihre Relevanz für das Forschungsvorhaben erhalten sie aus 
unterschiedlichen Motivationen. So ist es einerseits entscheidend, systematisch 
(Experten-) Wissen auf Basis des fachdidaktischen Wissens über Diagnose zu 
eruieren und im Kontext des eigenen fremdsprachlichen Leseunterrichts zu 
beleuchten sowie das generelle theoretische Wissen über Diagnoseinstrumente 
zu erforschen. Andererseits sind implizite Wissens- und Deutungsmodelle der 
Lehrkräfte in Bezug auf die „subjektive Dimension“ (Bogner/Menz 2005: 38) als 
persönliche Einschätzung der Leseleistungen der Schülerinnen von Bedeutung 
für die Forschungsfrage. Den Status „Experten“ erhielten die Lehrkräfte aufgrund 
ihres professionellen Handlungsfeldes sowie angesichts ihres speziellen Wissens 
und ihrer Expertise in fachdidaktischen und fachwissenschaftlichen Bereichen.' 

Die leitfadengestützten Interviews wurden als Einzelinterviews geführt, um 
individuelle Diagnosemaßnahmen und spezifisches unterrichtliches Handeln 
zu erforschen. Der Leitfaden bewegte sich auf einem Kontinuum von starker 
Strukturierung des Interviews bis hin zu einer offenen Gesprächsführung mit 
abwechselnd stark geführten und offenen Fragen. So ergaben sich für die Inter- 
viewführung zwei Phasen: In der ersten Phase wurden die Lehrkräfte gebeten, 


1 Zur Unterscheidung der Dimensionen von Expertenwissen siehe u.a. Bogner/Menz 
(2005: 43f.) und Meuser/Nagel (2005: 73ff.). 
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zwei kurze Videosequenzen (prompts’) von Schülerinnen der fünften Klassen- 
stufe anzuschauen. Die videografierten Schülerinnen lasen einzeln einen kur- 
zen fremdsprachigen Sachtext und wurden dazu aufgefordert, Lesestrategien zu 
verwenden, die für die Klassenstufe als relevant angesehen werden können, z.B. 
Wichtiges unterstreichen, intelligent guessing, etc. Die Handlungen der Schüle- 
rinnen und Schüler ermöglichten eine direkte Beobachtung, ob und welchem 
Umfang Lesestrategien angewendet werden. Fragen über das individuelle Lese- 
verhalten, die Lesefreude und die Textsortenpräferenz der Schülerinnen wurden 
ebenfalls in das Video mit aufgenommen. Im Anschluss an die Betrachtung der 
Videoausschnitte sollten die Lehrkräfte die fremdsprachlichen Leseleistungen der 
Schülerinnen und Schüler (subjektiv) einschätzen. Dazu wurden ihnen sehr of- 
fene Fragen gestellt (z.B. Wie schätzen Sie die Leseleistung ein und wie würden 
Sie Ihre Einschätzung begründen?). In der zweiten Phase des Interviews wur- 
den stärker strukturierte Fragen zu fachdidaktischem Wissen von Diagnose im 
fremdsprachlichen Leseunterricht, zu theoretischem Wissen über Diagnosein- 
strumente sowie zu den Fortbildungsbedürfnissen der Lehrkräfte hinsichtlich 
der eigenen Diagnosekompetenz gestellt. Zentrale Ziele der zweiten Phase des 
Interviews waren, das Erfahrungswissen der Lehrkräfte sowie das Wissen über 
theoretische Konstrukte von Diagnose(-kompetenz) zu erfragen. So leitete eine 
erste Frage (Wie würden Sie das Lesen bei den einzelnen Schülerinnen einschät- 
zen?) offen in die Interviewsituation ein und ermöglichte den Lehrkräften von 
der Situation ausgehend zu beschreiben, was sie sehen und dies mit ihrem (Fach-) 
Wissen zu verknüpfen. 

Das Datenmaterial aus der ersten Phase der Interviews wurde also mithilfe 
einer Erzählaufforderung (ausgelöst durch einen visuellen Impuls) generiert. In 
der zweiten Phase des Interviews konnte das in der Erzählung explizierte, ur- 
sprünglich implizite Wissen der Lehrkräfte über Diagnose von fremdsprachlicher 
Lesekompetenz mit explizit verfügbarem Wissen aus der individuellen Lehrpra- 
xis (in Form verbaler Daten) in Beziehung gesetzt und trianguliert werden. Die 
Triangulation zweier Datensätze (Erzählaufforderung und Leitfadeninterview) 
innerhalb einer Methode (Interview) lässt sich der Methodentriangulation und 
hier insbesondere der within-method triangulation zuordnen (vgl. Flick 2011: 
27f.). Das Verständnis von Triangulation, das dem hier beschriebenen Vorha- 
ben zugrunde liegt, lässt sich als Erkenntniserweiterung bezeichnen, wobei die 


2 In Anlehnung an das Erhebungsinstrument stimulated recall (vgl. u. a. Gass/Mackey 
2000) verwendetes Instrument, das die Interviewpartner zu Kommentaren bzgl. der 
vorgespielten Situation veranlassen soll. 
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einzelnen Datensätze eine komplementäre Funktion haben und nicht notwendi- 
gerweise Konvergenz anstreben, wie dies im Falle der Triangulation als Validie- 
rungsstrategie erstrebenswert ist (vgl. Settinieri in diesem Band). Durch diese 
Konstruktion der Interviewsituation erhoffte ich mir eine vielschichtige und 
multiperspektivische Ergänzung meines Forschungsgegenstandes: „We should 
combine theories and methods carefully and purposefully with the intention of 
adding breadth or depth to our analysis but not for the purpose of pursuing ‚ob- 
jective‘ truth“ (Fielding/Fielding 1986: 33). 


3. Datenerhebung: Planung und Durchführung 
der Interviews 


Für die Datenerhebung wurden dreizehn Personen mittels des ‚Schneeballprin- 
zips‘ (vgl. Kruse 2011: 89) ausgewählt. Hierzu sprach ich eine mir bekannte 
Lehrerin an, die mich dann auf weitere Kolleginnen und Kollegen verwies, die 
wiederum weitere Lehrkräfte kannten, etc. Die insgesamt zehn weiblichen und 
drei männlichen Lehrkräfte unterrichten am Gymnasium (neun Lehrkräfte), an 
einer Integrierten Gesamtschule (zwei Lehrkräfte), und an einer Kooperativen 
Gesamtschule (eine Lehrkraft) im Großraum Frankfurt am Main. Die Inter- 
views wurden allesamt an den jeweiligen Schulen der Lehrkräfte durchgeführt 
und erforderten ein hohes Maß an Flexibilität auf Seiten der Forscherin (z.B. 
unterschiedliche Zeiten an unterschiedlichen Tagen, Zeitdruck der Lehrkräfte 
auf Grund sich anschließender Unterrichtsstunden, Störgeräusche, etc.). Die Be- 
fragungen dauerten durchschnittlich 60 Minuten. 

Ausschlaggebende Kriterien für die Auswahl der Interviewpersonen waren 
das Abhalten des Englischunterrichts in Klasse fünf/sechs, die zu unterrichtende 
Schulart sowie eine breite Streuung der Studienabschlüsse des Zweiten Staats- 
examens (vor und nach der bildungspolitischen Intervention der KMK und der 
Einführung der Bildungsstandards) und die damit verbundene Berufserfahrung. 
Ziel war es, die implizite und explizite Diagnosekompetenz von Lehrkräften al- 
ler Schularten möglichst umfassend abzubilden. Von Interesse war zudem die 
Frage, ob sich Unterschiede in der jeweiligen Diagnosekompetenz der Befragten 
mit Blick auf ihre Berufserfahrung bzw. den Zeitpunkt des Studienabschlusses 
feststellen lassen? Mithilfe dieser Kriterien sollte eine möglichst große Perspek- 
tivenvielfalt gewährleistet werden. 


4. Der Auswertungsprozess 


Nach der erfolgreichen Phase der Datenerhebung wurden die Interviews tran- 
skribiert und für den Auswertungsprozess aufbereitet. Kvales (2009) Anspruch 
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für eine umsichtige Datenauswertung - „entering into a dialogue with the text, 
going into an imagined conversation with the ‚author‘ about the meaning of the 
text“ (Kvale 2009: 192) - stellt zwei Leitprinzipien vor, die für die Wahl der Aus- 
wertungsmethode des hier beschriebenen Forschungsvorhabens ebenfalls von 
Bedeutung sind: Offenheit und das Arbeiten am Datenmaterial. Das Prinzip der 
Offenheit (vgl. u.a. Steinke 1999: 35ff.) wird in der Qualitativen Sozialforschung 
oftmals beschrieben als starke Zurückhaltung des Forschenden gegenüber the- 
oretisch-geleiteten Deutungen des Materials (vgl. Lamnek 2002: 165). Dieses 
Prinzip kommt in der Wahl einer induktiven Auswertungsmethode - der Zu- 
sammenfassenden Inhaltsanalyse - zur Anwendung, die aber dennoch von einer 
gewissen „theoretischen Sensibilität“ (Glaser/Strauss 1998: 54) gekennzeichnet 
ist (z.B. durch Kenntnisse aus Literaturrecherche). 

Angesichts der methodischen Vorüberlegungen zum systematisierenden 
und theoriegenerierenden Experteninterview erweist sich die Qualitative 
Inhaltsanalyse (vgl. Mayring 2008, Gläser/Laudel 2010, Kuckartz 2012°) als 
sinnvoll, die folgende Merkmale aufweist: „Die Qualitative Inhaltsanalyse will 
sprachliches Material systematisch analysieren, indem sie das Material zerglie- 
dert und schrittweise bearbeitet, theoriegeleitet am Material ein Kategoriensys- 
tem entwickelt und die Analyseaspekte vorher festlegt“ (Kuckartz 2010: 92f.). 
Die Qualitative Inhaltsanalyse ist also ein regelgeleitetes und systematisches 
Verfahren, dessen Intention es ist, „das Material so zu reduzieren, dass die we- 
sentlichen Inhalte erhalten bleiben, durch Abstraktion einen überschaubaren 
Corpus zu schaffen, der immer noch Abbild des Grundmaterials ist“ (Mayring 
2008: 58). 

In einem ersten Analyseschritt werden die Interviews mittels der Zusammen- 
fassenden Inhaltsanalyse ausgewertet (vgl. Mayring 2008: 59ff.), um das Wissen 
der befragten Experten möglichst genau und unvoreingenommen zu beschrei- 
ben. Daher werden zunächst induktiv Kategorien gebildet mit dem Ziel, die kom- 
plexen inhaltlichen Aussagen der Lehrkräfte abzubilden und um eine möglichst 
detailgetreue Abbildung vom Datenmaterial, ähnlich dem Offenen Codieren in 
der Grounded Theory (Glaser/Strauss 1998), zu erhalten. In einem zweiten Schritt 
wird die Zusammenfassende Inhaltsanalyse in die Inhaltlich Strukturierende 


3 Die hier benannten Autoren bedingen und ergänzen sich gegenseitig. So hat May- 
ring in seinem Werk sein Verfahren der qualitativen Inhaltsanalyse vertieft, welches 
Kuckartz (2012) aufgreift und insbesondere vor dem Hintergrund einer computer- 
gestützten Auswertung beleuchtet. Gläser/Laudel (2010) wiederum übertragen die 
Auswertungsmethode Mayrings gezielt auf das Experteninterview, zeigen Vorzüge 
und Nachteile dieser Methode auf. 
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Inhaltsanalyse integriert, um die aus den Bezugstheorien (Diagnose und fremd- 
sprachliches Lesen) stammenden Kategorien deduktiv, gleichsam als Schablone 
auf das Material zu projizieren. Die alleinige Verwendung der Zusammenfassen- 
den Inhaltsanalyse erscheint mir für die vorliegende Forschungsarbeit und die 
damit verbundene Forschungsfrage nicht zielführend, da das Gütekriterium „in- 
tersubjektive Nachvollziehbarkeit“ (Steinke 2007: 324ff.) hinsichtlich der thema- 
tischen Vergleichbarkeit der Aussagen nicht gegenstandsangemessen gesichert 
werden konnte. Mit der Integration Zusammenfassenden Inhaltsanalyse in die 
Inhaltlich Strukturierte Inhaltsanalyse kann gewährleistet werden, dass theorie- 
geleitete Kategorien das induktiv gebildete Kategoriensystem ergänzen und der 
Auswertung eine größere „Differenziertheit, Komplexität und Erklärungskraft“ 
(Kuckartz 2012: 77) verleihen. 

Die nachfolgende Abbildung soll das methodische Vorgehen des Auswer- 
tungsprozess veranschaulichen: 


Abb. 1: Methodisches Vorgehen (in Anlehnung an Kuckartz 2012). 


Schritt 8: Anwenden der Hauptkategorien 
kategorienbasierte Auswertung aus Leitfaden bei gleichzeitiger 
an Hauptthemen (inter-und sequentieller Paraphrasierung 
intra-textuell) sowie des gesamten Datenmaterials 
Ergebnisdarstellung mit MAXQDA-Software 


Schritt 7: Schritt 2: 

Anwenden der deduktiven Kate- Generalisierung der gesamten 
gorien aus Bezugstheorien auf Codiereinheiten des 
bestehendes Kategoriensystem Datenmaterials auf festgelegtes 
Forschungsfrage Abstraktionsniveau 


Schritt 6: 

synoptische und querschnitts- 

artige Zusammenstellung des Schritt 3: 

Kategoriensystems als Streichen und Bündeln 

Text-Retrieval von bedeutungsgleichen 
Codiereinheiten mittels 
Text-Retrieval 


Schritt 5: Schritt 4: 

konsensuelles Codieren mit induktives Bilden von Sub- 
Forschungspartner (Forscher- Kategorien am gesamten Daten- 
triangulation) material entlang 
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Schritt 1: 

Ausgehend von der Forschungsfrage und dem Leitfaden ergeben sich folgende 
vorläufige thematische Hauptkategorien, die als Raster zur Gliederung der Fülle 
des Datenmaterials im Sinne von Analyseheuristiken eingesetzt werden: ‚Ein- 
schätzung der videografierten Schülerinnen, ‚Unterrichtsmethoden;) ‚generelle 
Verfahren zur Diagnose, ‚Kenntnis über Diagnoseinstrumente‘ und ‚Wünsche 
für die Weiterbildung. Auf Grundlage dieser Hauptkategorien werden das 
gesamte Datenmaterial sequenziell analysiert und relevante Sinneinheiten 
durch Paraphrasierung den Kategorien zugeordnet. Unter Sinneinheiten sind 
mindestens ein in sich verständlicher Teilsatz bis hin zu bedeutsamen Absät- 
zen einschließlich der Interview-Frage zu verstehen, falls diese für die Inter- 
pretation der Aussage relevant ist. „Wichtigstes Kriterium ist, dass die Textstelle 
ohne den sie umgebenden Text für sich alleine ausreichend verständlich ist“ 
(Kuckartz 2012: 82). Zudem werden Textstellen mit derselben thematischen 
Information ebenfalls paraphrasiert, um einer vorschnellen Interpretation vor- 
zubeugen. Bei der Analyse fiel auf, dass die Befragten immer wieder weitere 
Themen anschnitten, wie zum Beispiel Übergang von Primar- zur Sekundar- 
stufe, Differenzierung oder bildungs- und schulpolitische Themen, sodass das 
Kategoriensystem um zwei weitere Hauptkategorien zu ergänzen war: ‚Allge- 
meine Aussagen über Unterricht und Lernende‘ (ähnlich dem offenen Codie- 
ren in der Grounded Theory, vgl. Glaser/Strauss 1998) und ‚Bildungspolitik/ 
Schulpolitik‘ Diese Erweiterung der Hauptkategorien macht deutlich, dass die 
Kontexte der Lehrkräfte sehr vielschichtig und differenziert sind. Das bis dato 
analysierte Datenmaterial wurde erneut auf die neuen Hauptkategorien hin 
überprüft und entsprechende Textstellen codiert. Durch die Verwendung von 
MAXOQDA konnte die Datenmenge zeiteffizient und systematisch am Compu- 
ter analyisiert und bearbeitet werden. Das Kategoriensystem (oder Codesystem 
in MAXQDA) stellt sich wie folgt dar: 


Abb. 2: Angewandtes Kategoriensystem. 


oe Codesystem 
-oà Generelle Verfahren zur Diagnose 


)-© a Wünsche für die Weiterbildung 
-oE Allgemeine Aussagen über Unterricht und Lernende 
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Über die Möglichkeit, in MAXQDA Memos als Gedankenstütze während des 
Codier-Prozesses zu verfassen, werden zum einen sogenannte Code-Memos 
und zum anderen sogenannte Dokument-Memos festgehalten. Beide Funkti- 
onen dienen als digitales Forschertagebuch, um zum Beispiel Auffälligkeiten 
von Sprachäußerungen während des Codierens einer Person zuzuordnen, An- 
kerbeispiele festzuhalten, oder generelle Informationen über die Personen zu 
dokumentieren. 

Im Anschluss an den Prozess des Paraphrasierens können die den Hauptkate- 
gorien zugeordneten Codes einer Person in eine Excel-Tabelle exportiert werden, 
um die weiteren Schritte der Zusammenfassenden Inhaltsanalyse zu vollziehen. 


Schritt 2-4: 

Nachfolgende Abbildung zeigt die systematische Darstellung des Ablaufmodells 
der Zusammenfassenden Inhaltsanalyse, wobei die von Mayring (2008) beschrie- 
ben siebenschrittige Analyse auf Grund der Datenfülle verkürzt wurde (vgl. 
Mayring 2008: 60ff.). 


Abb. 3: Beispiel für die Zusammenfassende Inhaltsanalyse. 


Haupt- li- | Reduk- b- ; 
Aue Paraphrase Genera i on an ._ | Textbelegstelle | Zeile 
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was aber ei- 
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Peer Evaluation 
Peer- 
. i schon mal des- 
Kenntnis Evaluation R 
2 j Prob- Problem: wegen schwie- 
über ist problema- i Peer ; i 102- 
: A A lem des sozialer . rig macht, ist 
Diagnose- |tisch, da sie 5 Evaluation | ,: 102 
2 . . Zuhörens |Faktor die Tatsache, 
instrumente | sich nicht = 
A dass es häufig 
zuhören Br 
kaum möglich 
ist, dass sie ein- 
ander zuhören 


Im zweiten Schritt des Analyseprozesses werden die Paraphrasen auf ein Abs- 
traktionsniveau weg von umgangssprachlichen Äußerungen der Befragten hin 
zu verallgemeinernden Aussagen im Sinne einer Generalisierung festgelegt. In 
Schritt drei erfolgt dann das Streichen und Bündeln von bedeutungsgleichen Co- 
diereinheiten, auch im Sinne einer Reduktion des bis dahin sehr umfangreichen 
Datenkorpus. Durch das Zusammenstellen aller Textbelegstellen innerhalb eines 
Interviews mit derselben Bedeutung - auch Text-Retrieval genannt - können dann 
aus dem Material heraus geordnete und systematisierte Sub-Kategorien gebildet 
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werden (Schritt 4). Als Unterschied zu anderen Auswertungsmethoden bezieht 
sich die Zusammenfassende Inhaltsanalyse nur im ersten Schritt der Paraphra- 
sierung auf das Originaltranskript und damit die Quellenangaben, konzentriert 
sich dann jedoch lediglich auf die aus dem Text entnommenen Informationen 
(zum Beispiel Mayring 2008: 64ff.). Diese Loslösung vom eigentlichen Inter- 
viewtranskript und der damit einhergehenden starken Fokussierung auf eigene 
Rückschlüsse birgt die Gefahr einer frühzeitigen entkoppelten Interpretation, die 
ohne Rückbezug auf Textbeispiele vollzogen wird. Daher erscheint es mir unum- 
gänglich, die Spalten sechs (Textbelegstelle) und sieben (Transkriptzeile) in die 
Übersicht mit aufzunehmen, auch um dem Leitprinzip „am Material“ weiterhin 
zu folgen. Insbesondere die siebte Spalte erlaubt es, im Zweifel die Textstelle im 
Transkript in MAXQDA wiederzufinden und am Material zu kontextualisieren. 


Schritt 5: 

Nachdem die Sub-Kategorien induktiv im Analyseprozess gebildet worden 
sind, wird nun das gesamte Datenmaterial in einem weiteren Schritt von einer 
zweiten Forscherin durch eine ebenfalls induktive Herangehensweise analy- 
siert, um die Qualität des Codierprozesses zu maximieren. Diese Validierung 
erfolgt nach dem Prinzip des konsensuellen Codierens (vgl. u.a. Schmidt 
1997). Um im Anschluss an das unabhängige Codieren einen diskursiven Kon- 
sens finden zu können, wird vorab ein Kategoriensystem festgelegt. Hierzu 
stelle ich meine thematischen Hauptkategorien meiner Forschungspartnerin 
zur Verfügung, die wiederum in einem individuellen Arbeitsprozess die Tran- 
skripte analysiert. Das Verfahren, die eigene Forschung von unterschiedlichen 
Punkten aus zu betrachten (vgl. Flick 2011: 11) und darüber in einen wissen- 
schaftlich fundierten Dialog zu treten, ist ein wesentliches Qualitätsmerkmal 
von intersubjektiv nachvollziehbarer Forschung, welche durch eine Forscher- 
triangulation (vgl. u.a. Seipl/Rieker 2003: 225, Flick 2011: 14) gesichert wird. 
Dadurch können Sub-Kategorien an unklaren Punkten präziser definiert 
werden. Dies erfolgte zum Beispiel bei der Hauptkategorie „Wünsche für die 
Weiterbildung‘; bei der meine Forschungspartnerin und ich weitere Sub-Ka- 
tegorien festlegten: „Wünsche generell“, „Wünsche Material“ und „Wünsche 
Ablauf einer Fortbildung“. 

Für das konsensuelle Codieren werden zwei unterschiedliche Medien einge- 
setzt: einerseits werden einige Interviews mittels der paper-and-pencil Technik 
(vgl. Kuckartz 2010: 13) codiert, andererseits wird auf die Software MAXQDA 
zurückgegriffen. Diese erlaubt es, im Team zu arbeiten, indem verschiedenfar- 
bige Codes entweder Übereinstimmung oder Unterschiede der Forschungspart- 
ner signalisieren. Mithilfe dieser farbigen Hervorhebungen kann das Material 
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zunächst auf Gemeinsamkeiten und Unterschiede hin überprüft werden, um 
dann in einem zweiten Schritt mit der Forschungspartnerin in einen Dialog zu 
treten und im Zweifel Sub-Kategorien zu präzisieren. 


Schritt 6: 

Nachdem die Sub-Kategorien diskutiert und zum Teil präzisiert worden sind, 
erfolgt im nächsten Schritt eine synoptische und übersichtliche Einordnung des 
Kategoriensystems (Hauptkategorien und Sub-Kategorien) innerhalb eines In- 
terviews. Des Weiteren wird eine querschnittartige Zusammenstellung des Ka- 
tegoriensystems aller Interviews vorgenommen, um erste Einsichten in Bezug 
auf die thematische Vergleichbarkeit der Aussagen und der Sub-Kategorien zu 
erhalten. 


Schritt 7: 

Maßgeblich entscheidend für den siebten Schritt ist der Abgleich der deduktiv 
gebildeten Kategorien (Evaluierungskompetenz, Kompetenzwissen über fremd- 
sprachliches Lesen, Bedingungswissen, technologisches Wissen oder diagnos- 
tische Methodenkompetenz, Änderungswissen und Vergleichswissen) mit den 
zuvor induktiv gebildeten Sub-Kategorien in einer Excel-Tabelle. Dieser Schritt 
dient zur weiteren Validierung des vorab gebildeten Kategoriensystems, zur 
Rückbindung der Ergebnisse an die Forschungsfrage sowie als Systematisierung 
im Hinblick auf das Verfassen des Forschungsberichts. 


Schritt 8: 

In einem letzten Schritt werden die Haupt- und Sub-Kategorien schriftlich aus- 
gewertet. Hilfreich in diesem Prozess waren folgende vorab generierte Fragen: 
„Was wird zu welcher Kategorie alles gesagt?“ und „Was wird zu welcher Kate- 
gorie nicht gesagt? Was steht bei den befragten Lehrkräften im Vordergrund?“ 
Diese Leitfragen legen den Schluss nahe, sowohl inter- als auch intratextuell vor- 
zugehen, um dann die Sub-Kategorien entlang der Hauptthemen thematisch zu 
vergleichen und aufzubereiten. 


5. Zusammenschau: within-method Triangulation, 
konsensuelles Codieren und die technischen 
Möglichkeiten von MAXQDA 


Aufgrund der Methoden-Triangulation bei der Datenerhebung war es in der 
Auswertung möglich, den Datenkorpus dezidiert und vielschichtig zu analy- 
sieren. Die Erkenntnisse hinsichtlich der Diagnosekompetenz der Befragten in 
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Bezug auf das fremdsprachliche Lesen bilden eine große Perspektivenvielfalt ab, 
welche sowohl das explizit kommunizierte und verfügbare Erfahrungswissen 
sowie implizit und subjektiv formulierte Schilderungen der Lehrkräfte umfasst. 
Zum Beispiel gaben die Befragten an, Diagnoseinstrumente (z. B. Portfolio oder 
Peer Evaluation) trotz persönlichen Dafürhaltens aufgrund zeitlicher oder so- 
zialer Faktoren nicht einzusetzen. Folglich wünschen sie sich Fortbildungen, 
welche die Praktikabilität solcher Instrumente aufzeigen und sie unmittelbar im 
Unterricht einsetzbar machen. 

Die Auswertung „als Prozeß [sic] der Auseinandersetzung mit dem Ma- 
terial vor dem Hintergrund theoretischer Überlegungen“ (Schmidt 1997: 
548) zu begreifen, war Ziel einer induktiv-deduktiven Kategorienbildung so- 
wie -auswertung mithilfe der Qualitativen Inhaltsanalyse. Da die Qualitative 
Inhaltsanalyse zunächst sehr stark am und mit dem Material arbeitet, gleich- 
zeitig systematisierend den Datenkorpus aufbereitet und reduziert, erlaubt sie 
„eine methodisch kontrollierte und für jede/n nachvollziehbare Auswertung“ 
(Kuckartz 2012: 174). 

Um die Aussagen der Lehrkräfte zusammenzufassen, eignet sich die Zusam- 
menfassende Inhaltsanalyse als differenzierte Auswertungsmethode der Quali- 
tativen Inhaltsanalyse. Nach der vollständigen Auswertung der Interviews nach 
Mayring (2008) mittels der am Material gebildeten Kategorien wird dieses Ana- 
lyseverfahren mit dem der Inhaltlich Strukturierenden Inhaltsanalyse verknüpft, 
um dem Anspruch der intersubjektiven Nachvollziehbarkeit gerecht zu werden 
und thematische Vergleichbarkeit herzustellen. 

Angesichts der Fülle an Datenmaterial erwies sich die Verwendung der Soft- 
ware MAXQDA als äußerst hilfreich. Neben der problemlosen Zuordnung der 
Paraphrasen zu einzelnen Textabschnitten und der entsprechenden Verortung 
im Kategoriensystem sind das einfache Hin- und Herwechseln zwischen den 
einzelnen Interviews, das systematische Verfassen von Memos sowie das Expor- 
tieren der Daten in eine Excel-Tabelle mühelos realisierbar. Einzig die Länge der 
Paraphrasen ist in der Software auf eine bestimmte Zeichenanzahl beschränkt, 
sodass gelegentlich zwei sogenannte Codes für eine Paraphrase vergeben werden 
müssen, welche dann in mühsamer Arbeit in Excel wieder zu einer sinnvollen 
Paraphrase zusammengeführt werden müssen. 

Abgesehen von dieser Hürde bietet die Software auch im Hinblick auf das 
konsensuelle Codieren eine enorme Erleichterung, da es durch diese Art der 
Validierung möglich ist, die beiden separat entwickelten und induktiv gebil- 
deten Kategoriensysteme aufeinander zu beziehen, um so Gemeinsamkei- 
ten und Unterschiede der unterschiedlichen Forscherperspektiven sichtbar 
zu machen. Insgesamt stellt die Verwendung der Qualitativen Inhaltsanalyse 
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sowie die Auswertung mit MAXQDA eine geeignete Kombination für For- 
schungssettings dar, die sich dem Untersuchungsgegenstand zunächst explo- 
rativ nähern (induktive Kategorienbildung), um dann mittels einer deduktiven 
Herangehensweise eine thematische Vergleichbarkeit der einzelnen Interviews 
herzustellen. 
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Analyse quantitativer und qualitativer 
Befragungsdaten mit SPSS 


Astrid Jurecka 


Zur Untersuchung inhaltlicher Forschungsfragen werden in den Erziehungswis- 
senschaften und der Bildungsforschung immer häufiger Befragungsmethoden 
sowohl aus der quantitativen als auch der qualitativen Forschungstradition her- 
angezogen. Im Rahmen dieses Kapitels sollen Möglichkeiten und Strategien zur 
gemeinsamen Auswertung und Interpretation solcher Daten aufgezeigt werden. 
Im ersten Teil wird der Fokus zunächst auf den schriftlichen Fragebogen sowie 
das qualitative Interview als Beispiele für gängige Befragungsverfahren aus den 
beiden Forschungstraditionen gelegt. Ferner wird jeweils auf Grundlagen der 
Testkonstruktion, auf Itemformate, Skalenniveaus sowie das jeweilige Vorgehen 
bei der Quantifizierung von Daten eingegangen. Der letzte Teil des Beitrags be- 
inhaltet dann eine Darstellung gängiger statistischer Analyseverfahren sowie de- 
ren Durchführung mithilfe des Analyseprogramms SPSS. 


1. Einleitung 


Nachdem etwa seit Mitte der 1920er Jahre in den Sozialwissenschaften zwei metho- 
dische Forschungsrichtungen - die qualitative und die quantitative - unterschieden 
wurden (Kelle 2008), findet sich in den letzten Jahren unter den Begriffen „Metho- 
dentriangulation“ und Mixed Methods verstärkt wieder die Tendenz, Methoden aus 
beiden Forschungstraditionen zur Beantwortung und Untersuchung inhaltlicher 
Fragestellungen heranzuziehen (ebd.). So konstatieren etwa Gläser-Zikuda et al. 
(2012: 7f.) für die empirische Bildungsforschung und die Erziehungswissenschaf- 
ten die Etablierung qualitativer Forschungsmethoden, die stärkere Wahrnehmung 
quantitativer Forschungsmethoden, und die Kombination qualitativer und quanti- 
tativer Verfahren als derzeitige forschungsmethodische Trends. Dabei unterscheiden 
die Autoren bezüglich der Verbindung qualitativer und quantitativer Methoden un- 
terschiedliche Modelle: das Vorstudienmodell, das Verallgemeinerungsmodell, das 
Vertiefungsmodell sowie das Triangulationsmodell (ebd.: 8). Diese Modelle zeigen 
unterschiedliche Zeitpunkte und Stadien an, zu denen im Rahmen wissenschaftli- 
cher Studien eine Kombination beider methodischer Richtungen sinnvoll sein kann. 
So wird etwa im Rahmen des Vorstudienmodells, welches häufig zur Generierung 
von Hypothesen verwendet wird, eine qualitative der quantitativen Untersuchung 
vorgeschaltet, und bei Anwendung des Verallgemeinerungsmodells werden die 
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Ergebnisse einer vollständig durchgeführten qualitativen Studie anhand quantita- 
tiver Methoden auf Verallgemeinerung hin überprüft. Im Vertiefungsmodell hin- 
gegen werden zunächst quantitative Methoden angewandt, deren Interpretation 
anschließend unter Verwendung qualitativer Methoden vertieft wird, während im 
Rahmen des Triangulationsmodells Fragestellungen gleichzeitig anhand qualitativer 
und quantitativer Methoden bearbeitet werden (ebd.: 8). Ähnliche Vorgehensweisen 
werden auch bereits im Rahmen der Grounded Theory (z.B. Strauss/Corbin 1996) 
berichtet. Dort wird eine induktive, der Theoriebildung dienende Phase mithilfe 
offener, qualitativer Fragen einer deduktiven Phase der Theorieüberprüfung und 
Verallgemeinerung mithilfe von geschlossenen Itemformaten vorgeschaltet (Kon- 
rad 2011). Der Vorteil einer Kombination der Forschungsmethoden wird häufig in 
deren komplementärer Verwendung gesehen (z.B. Flick 2011), um so Schwächen 
des einen methodischen Ansatzes jeweils gezielt durch Stärken des anderen auszu- 
gleichen (Gläser-Zikuda et al. 2012, Kelle 2008, vgl. auch Settinieri in diesem Band). 

Wie bereits aus dieser knappen Darstellung kombinierter Anwendungsmög- 
lichkeiten qualitativer und quantitativer Forschungsmethoden ersichtlich wird, ist 
eine gemeinsame Auswertbarkeit von aus beiden methodischen Traditionen stam- 
menden Daten für alle dargestellten Modelle von großer Relevanz. Das vorliegende 
Kapitel wird sich daher speziell mit der Aufbereitung und gemeinsamen Analyse 
von Daten auseinandersetzen, die mithilfe von „qualitativen“ oder „quantitativen“ 
Befragungsmethoden erhoben wurden. Dabei wird zur besseren Nachvollziehbar- 
keit der Inhalte an den entsprechenden Stellen primär auf Standardwerke aus der 
Methodik verwiesen. Dies soll es dem Leser erleichtern, die hier lediglich über- 
sichtsartig dargestellten Thematiken eigenständig vertiefen zu können. 

In der sozialwissenschaftlichen Forschung erfolgt ein großer Teil der Da- 
tenerhebung anhand unterschiedlicher Befragungsformen. Im ersten Teil des 
Beitrags werden zunächst gängige Befragungsformen und Instrumente zur Da- 
tenerhebung aus der quantitativen und der qualitativen methodischen Tradition 
dargestellt. Dabei wird der Fokus vor allem auf dem schriftlichen Fragebogen 
(als Beispiel für eine traditionell eher quantitative Befragungsmethode) sowie 
dem Interview (als Beispiel für eine tendenziell eher qualitativ ausgerichtete Be- 
fragungsmethode) liegen. Ferner werden die für eine gemeinsame Auswertung 
der Daten notwendigen Schritte dargestellt. Statistische Analyseverfahren setzen 
dabei in der Regel voraus, dass die Daten quantifiziert sind, dass ihnen also ein 
numerischer Wert zugeordnet wurde (vgl. Kempf 2010, Konrad 2011), weshalb 
auf die Quantifizierung von Daten gesondert eingegangen wird. Im letzten Teil 
des Kapitels wird als Beispiel für eine computerbasierte Datenanalyse die Ana- 
lysesoftware SPSS vorgestellt, sowie auf die gängigsten statistischen Analysever- 
fahren und deren Umsetzung mithilfe des Programms eingegangen. 
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2. Die Befragung als Methode zur Datenerhebung 


Die Befragung ist eine der am häufigsten verwendeten Methoden zur Samm- 
lung von Informationen und Daten in der empirischen Forschung, wobei sich 
Alltagsfragen von wissenschaftlichen Fragestellungen hinsichtlich ihrer theore- 
tisch-wissenschaftlichen Fundierung und hinsichtlich des Grades der Standar- 
disierung unterscheiden (Konrad 2011: 4). Des Weiteren ist eine Befragung, vor 
allem bei Verwendung eines Fragebogens, systematisch und zielgerichtet, sie ist 
gegenstandsbezogen und findet unter kontrollierten Bedingungen statt (ebd.: 7). 

Eine Befragung kann entweder mündlich oder schriftlich erfolgen. Im ersten 
Fall werden dem Befragten durch einen geschulten Interviewer Fragen münd- 
lich gestellt oder vorgelesen, die dieser wiederum in mündlicher Form beant- 
wortet. Dies kann in einer Face-to-Face-Situation erfolgen, oder aber aus der 
Distanz (vgl. z.B. Broda 2006), beispielsweise über das Telefon oder über Video- 
telefonie. Im Falle einer schriftlichen Vorgabe liest und bearbeitet der Befragte 
die vorgegebenen Fragen üblicherweise eigenständig, und auch deren Beant- 
wortung erfolgt in schriftlicher Form. Sowohl mündliche als auch schriftliche 
Fragen können von offenem oder geschlossenem Format sein. Offenes Format 
bedeutet, dass dem Befragten keine Antwortmöglichkeiten vorgegeben werden. 
Dies ist häufig im Rahmen eines Interviews der Fall, es werden jedoch auch of- 
fene Antwortformate in Fragebögen verwendet. Geschlossene Antwortformate 
werden üblicherweise bei der Konstruktion schriftlicher Fragebögen angewandt, 
hier sind verschiedene konkrete Lösungs- oder Antwortmöglichkeiten jeweils 
vorgegeben (z.B. Bühner 2006). Eine detailliertere Darstellung unterschiedlicher 
Item- und Antwortformate erfolgt in den folgenden Abschnitten. 


2.1 Der schriftliche Fragebogen 


Der schriftliche Fragebogen gehört zu den gängigsten Befragungsmethoden in 
den Sozialwissenschaften. Obgleich er durchaus qualitativ ausgerichtet sein kann, 
beispielsweise bei gewähltem offenem Antwortformat, wird der Fragebogen auf- 
grund seines oft deduktiven Charakters und des meist geschlossenen Antwortfor- 
mats üblicherweise den quantitativen Methoden der Datenerhebung zugeordnet. 

Mithilfe eines Fragebogens können relativ schnell und ökonomisch die Daten 
einer großen Anzahl von Personen erhoben und ausgewertet werden, weshalb er 
gut zur Überprüfung der Allgemeingültigkeit von Theorien und Hypothesen ge- 
eignet ist. Im Rahmen von Fragebögen werden unter Verwendung geschlossener 
Antwortformate üblicherweise vorformulierte Antwortmöglichkeiten schrift- 
lich vorgegeben (z.B. Konrad 2011: 51; zu Vor- und Nachteilen verschiedener 
Itemformate siehe auch Jonkisz et al. 2011: 31ff.), von denen dann die jeweils 
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am ehesten zutreffende von der befragten Person ausgewählt wird. Fragebögen 
sind häufig in hohem Maße im Hinblick auf ihre Bearbeitung und Auswertung 
standardisiert. Nach Bühner (2006: 46) werden bei der Test- und Fragebogen- 
entwicklung unterschiedliche Stufen durchlaufen. Dabei handelt es sich unter 
anderem um Anforderungsanalyse und Problemstellung, Planung und Litera- 
tursuche, Eingrenzung des Merkmals und Arbeitsdefinition, Testentwurf und 
Überprüfung, Itemanalyse und Itemselektion, Kriterienkontrolle sowie Eichung/ 
Normierung des Testverfahrens (ebd.: 46ff.). 

Der Konstruktion eines Fragebogens geht üblicherweise eine spezifische 
Problem- bzw. Fragestellung voraus. Denkbar wäre etwa die Forschungsfrage, 
ob die selbst wahrgenommene muttersprachliche Kompetenz von Kindern mit 
Deutsch als Zweitsprache auch mit der tatsächlichen Sprachkompetenz in der Mut- 
tersprache übereinstimmt. Um diese Fragestellung zu untersuchen, könnte daher 
(neben einem entsprechenden Sprachtest) ein Fragebogen entwickelt werden, der 
die wahrgenommene muttersprachliche Kompetenz von Personen erfasst. 

Nach Festlegung der Problemstellung sowie Festlegung des zu untersuchenden 
Merkmals, welches in 0.g. Beispiel die wahrgenommene muttersprachliche Kom- 
petenz darstellt, folgen üblicherweise die Eingrenzung des Merkmals sowie eine 
genaue Definition des zu messenden Konstrukts. Dazu können unterschiedliche 
Quellen genutzt werden, wie beispielsweise zu der Thematik bereits existierende 
Theorien, empirische Studien, Testverfahren, oder auch die Durchführung einer 
Laien- oder Expertenbefragung (z.B. Bühner 2006: 47). Auf diese Weise wird das 
Merkmal mit allen dazugehörigen Facetten zunächst genau definiert. Darauf basie- 
rend werden erste Überlegungen dahingehend angestellt, auf welche Art und Weise 
das interessierende Merkmal konkret erfasst bzw. erfragt werden könnte. Für eine 
möglichst vollständige Erfassung des Merkmals „wahrgenommene muttersprach- 
liche Kompetenz“ wäre beispielsweise das Abfragen unterschiedlicher Aspekte 
sprachlicher Teilkompetenzen, wie etwa des Hör- oder Leseverstehens, denkbar. 

Anders als bei physikalischen Größen wie dem Gewicht oder der Länge eines 
Stocks lassen sich viele interessierende Merkmale leider nicht direkt beobach- 
ten oder messen. So ist es etwa, bezogen auf das hier verwendete Beispiel, nicht 
möglich, einem Menschen dessen Einschätzung der eigenen muttersprachlichen 
Kompetenzen direkt anzusehen. Das interessierende Merkmal bzw. die inter- 
essierende Eigenschaft wird daher häufig auch als latente Variable bezeichnet. 
Um also Aussagen bezüglich dieses Merkmals bei einer oder mehreren Personen 
machen zu können, oder anders ausgedrückt, um das Konstrukt zu operationa- 
lisieren (z.B. Breuer 2010: 40), muss zunächst das Merkmal beobachtbar bzw. 
sichtbar gemacht werden. Dies geschieht üblicherweise, indem - basierend auf 
theoretischen Annahmen sowie Ergebnissen bereits existierender empirischer 
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Studien - das Konstrukt anhand von Fragen, im Folgenden auch bezeichnet 
als Items, möglichst genau abgebildet wird. Die zugrundeliegende Annahme ist 
hier, dass durch die Beobachtung einer Handlung oder Reaktion einer Person 
(in diesem Falle die Beantwortung eines Items) Rückschlüsse auf die zugrunde- 
liegende, latente Variable und den Grad der Ausprägung einer Person bezüglich 
dieses Merkmals gezogen werden können. Zur Messung der wahrgenommenen 
muttersprachlichen Kompetenzen könnte beispielsweise unter anderem ein Item 
formuliert werden wie „Wie schätzen Sie ihre muttersprachlichen Fähigkeiten 
bezüglich des Lesens von literarischen Texten ein?“, zu beantworten auf einer 
mehrstufigen Antwortskala (z.B. 1 = sehr gering; 5 = sehr gut). Diese beobacht- 
baren Antworten auf Items werden auch häufig als manifeste Variable bezeichnet. 

Üblicherweise wird so in einem ersten Entwurfeines Fragebogens ein sogenann- 
ter Itempool erzeugt, d.h. eine größere Anzahl von Items, von denen - basierend 
auf den vorherigen Recherchen - angenommen wird, dass sie das interessierende 
Konstrukt abbilden. Dabei muss darauf geachtet werden, dass alle Facetten eines 
Konstrukts korrekt repräsentiert sind, da es ansonsten zu einer Konstruktunterre- 
präsentation, oder aber zur Erhebung konstruktirrelevanter Variablen und somit 
einer Einschränkung der Validität kommen kann (z.B. Messick 1989). 


2.1.1 Itemformate 


Im Zuge der Konstruktion eines Items muss ferner festgelegt werden, welches 
Format ein Item haben soll. So existieren, wie bereits erwähnt, offene oder ge- 
schlossene Itemformate. Obgleich in schriftlichen Fragebögen auch offene 
Itemformate verwendet werden können, werden diese tendenziell eher den qua- 
litativen Befragungsformen zugeordnet. Auf offene Antwortformate wird daher 
im Rahmen der Darstellung qualitativer Befragungsformen eingegangen. Übli- 
cherweise besitzt bei quantitativen Befragungen der größte Teil der Fragen ein 
geschlossenes Antwortformat (Broda 2006: 70). Das bedeutet, dass die befragte 
Person sich für eine vorgegebene Antwortalternative entscheiden muss. Beispie- 
le für geschlossene Antworten sind etwa Multiple-Choice- und Richtig-Falsch- 
Fragen, oder auch Rating-Skalen. 

Anhand von Rating-Skalen (auch bezeichnet als Likert-Skalen) soll ein Merk- 
mal hinsichtlich der Stärke seiner Ausprägung erfasst werden. Dazu werden bei 
der Rating-Skala üblicherweise unterschiedliche Abstufungen bzw. Kategorien 
benannt. Die befragte Person soll dann wählen, welche Antwortalternative, d.h. 
welche Merkmalsausprägung, am ehesten auf sie zutrifft. Beispiele für solche 
Skalen sind die Häufigkeitsskala, die Intensitäts-, die Wahrscheinlichkeits- oder 
die Bewertungsskala (Bühner 2006: 54). 
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Bei solchen Itemformaten muss außerdem die Anzahl der Merkmalsabstu- 
fungen festgelegt werden. Dies ist dabei prinzipiell dem Testautor überlassen, 
wobei jedoch beachtet werden sollte, dass nicht eine zu geringe oder eine zu gro- 
ße Anzahl an Antwortkategorien gewählt wird. Üblich ist eine Anzahl von vier 
oder fünf Antwortkategorien, wobei häufig Skalen ohne eine mittlere Kategorie 
(beinhaltet oft Formulierungen wie „vielleicht“, „manchmal“, „mittel“, etc.) ge- 
wählt werden, um die Ambiguität dieser mittleren Kategorie auszuschließen. 


2.1.2 Das Skalenniveau 


Ziel und Grundlage des Messens ist die Abbildung des sogenannten empirischen 
Relativs in ein numerisches Relativ. Nach Bortz und Schuster (2010: 13) lässt 
sich ein Messvorgang „allgemein dadurch charakterisieren, dass einem Objekt 
bezüglich der Ausprägung einer Eigenschaft eine Zahl zugeordnet wird“. Das zu 
messende Konstrukt muss mit Beobachtungs- und Messoperationen verknüpft 
werden (vgl. Breuer 2010) und mithilfe von Testitems, die jeweils wiederum von 
einem bestimmten Antwortformat sind, operationalisiert werden (z.B. Bühner 
2006). „Das Messen ist eine Zuordnung von Zahlen zu Objekten oder Ereignis- 
sen, sofern diese Zuordnung eine homomorphe Abbildung eines empirischen 
Relativs in ein numerisches Relativ ist“ (Bortz/Schuster 2010: 16). Diese Abbil- 
dung wird auch als Skala bezeichnet. Das sogenannte Skalenniveau gibt dabei Re- 
geln an, welche Eigenschaften eine bestimmte Skala besitzt, und speziell welche 
Transformationen von Werten jeweils erlaubt sind, ohne dass Informationen da- 
durch verloren gehen (Borg/Stauffenbiel 1997). Borg und Stauffenbiel (1997: 6) 
beschreiben das Skalenniveau als eine auf Hypothesen bezüglich des Zusammen- 
hangs von Werten mit anderen Beobachtungen basierende „Rollenzuweisung“. 

Das Skalenniveau bezieht sich also auf Messeigenschaften von Items, Skalen 
und Testkennwerten (Bühner 2006: 73). Die bekanntesten und wichtigsten Ska- 
lenniveaus sind die Nominalskala, die Ordinalskala, die Intervallskala und die 
Verhältnisskala (z.B. Bortz/Schuster 2010). Diese werden im Folgenden kurz 
dargestellt, da das Skalenniveau für die unten dargestellte Quantifizierung von 
Daten sowie für die Frage, welche statistischen Auswertungsverfahren jeweils 
zulässig sind, von Relevanz ist. Dabei schließt jedes höhere Skalenniveau die für 
niedrigere Niveaus zulässigen Transformationen jeweils mit ein. 

Die Nominalskala ist das „schwächste“ (Borg/Stauffenbiel 1997: 5) Skalenni- 
veau. Üblicherweise werden Antwortformate, bei denen eine Antwort einzelnen 
wertfreien Kategorien zugeordnet werden kann, dem Nominalskalenniveau zu- 
geordnet (z.B. Bühner 2006: 74). Ein denkbares Beispiel wäre hier etwa die Fra- 
ge nach der Lieblingsfarbe (Antwortmöglichkeiten: rot, grün, blau, gelb). Hier 
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können lediglich Aussagen getroffen werden, die angeben, ob die gleiche oder 
eine andere Kategorie von unterschiedlichen Personen oder Personengruppen 
gewählt wurde, oder aber Aussagen bezüglich der Häufigkeit des Vorkommens 
der verschiedenen Antwortkategorien (z.B. die am häufigsten gewählte Farbe ist 
rot; 20 % haben die Farbe Gelb gewählt, etc.). 

Der Ordinalskala hingegen werden Daten zugeordnet, anhand derer auch 
vergleichende Aussagen (besser/schlechter, größer/kleiner, etc.) getroffen wer- 
den können (vgl. Bühner 2006). Die Größe der Werte spiegelt auch deren Rang- 
ordnung wieder (vgl. Rost 1996: 19), dennoch muss der Abstand zwischen den 
unterschiedlichen Werten nicht gleich groß sein. Ein denkbares Beispiel wäre 
hier die Platzierung von Teilnehmern eines 100-Meter-Laufs: Hier wird, je nach 
Geschwindigkeit, den Personen Platz 1, 2, 3 etc. zugeteilt, allerdings muss der 
zeitliche Abstand zwischen Person 1 und Person 2 nicht genauso groß sein wie 
zwischen Person 2 und Person 3. 

Intervallskalierte Werte weisen hingegen die gleichen Abstände (Intervalle) 
auf (z.B. Rost 1996). Ein häufig genanntes Beispiel ist hier die Temperatur in 
Celsius. Hier sind außerdem Aussagen bezüglich Differenzen möglich, wie z.B. 
„10 Grad Celsius ist halb so warm wie 20 Grad Celsius“, etc. Eine weitere Skala 
stellt die Verhältnisskala dar. Dieser werden viele physikalische Messungen zu- 
gewiesen, wie etwa die Länge in cm oder das Gewicht in kg. Hier können Aussa- 
gen hinsichtlich der Gleichheit von Verhältnissen getroffen werden (vgl. Bortz/ 
Schuster 2010: 15). 

Unterschiedlichen Antwortformaten können unterschiedliche Skalenniveaus 
zugeordnet werden. Welches Skalenniveau beispielsweise eine Rating-Skala hat, 
ist dabei bislang nicht abschließend geklärt. In Abhängigkeit davon, ob die Ab- 
stände zwischen den Abstufungen der Skala gleich sind oder nicht, kann für die 
Rating-Skala entweder ein Ordinal- oder Intervallskalenniveau angenommen 
werden (siehe dazu auch Bühner 2006: 55). Die meisten gängigen statistischen 
Auswertungsverfahren setzen eine Skalierung mindestens auf Intervallskalenni- 
veau voraus. 


2.1.3 Codierung und Quantifizierung 


Die Codierung und Quantifizierung von aus geschlossenen Antwortformaten 
stammenden Daten ist in der Regel relativ problemlos möglich (vgl. Konrad 
2011: 89). So liegen häufig Werte wie das Alter oder bestimmte Reaktionszeit- 
werte bereits in Zahlenform vor. Bezüglich geschlossener Antworten mit meh- 
reren Antwortkategorien werden üblicherweise den Antwortkategorien Zahlen 
zugeordnet. So kann beispielsweise der Antwortmöglichkeit „stimme nicht zu“ 
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die Zahl eins zugewiesen werden, „stimme eher nicht zu“ die Zahl 2, etc. Wenn 
die Antwortkategorien dabei eine mehr oder weniger starke Ausprägung eines 
Merkmals abbilden, dann ist es häufig sinnvoll, der niedrigsten Ausprägung 
auch die niedrigste Zahl zuzuordnen, da dies die Auswertung und Ergebnis- 
interpretation vereinfacht. Aber auch bei nominal skalierten und dichotomen 
Items, wie etwa der Frage nach dem Geschlecht, sollten den Kategorien festge- 
legte Zahlenwerte zugeordnet werden. So könnte etwa die Kategorie „weiblich“ 
mit 1, und „männlich“ mit 2 codiert werden. Ist eine Frage einfach mit „Ja“ oder 
„Nein“ beantwortbar, dann wird „Ja“ üblicherweise die Zahl 1, und „Nein“ die 
Zahl 0 zugeordnet. Gleiches gilt für Richtig-Falsch-Antworten. 

Schwieriger wird die Zuordnung bei Mehrfachantworten. In der Regel soll- 
ten sich die unterschiedlichen Werte einer Variablen gegenseitig ausschließen 
(Janssen/Laatz 2013: 297). Allerdings kommt es vor, dass bei einer Frage mehre- 
re Antwortmöglichkeiten zugelassen sind. In diesem Fall kann eine dichotome 
Variable pro Antwortmöglichkeit gebildet werden. Jeder dieser Variablen wird 
dann beispielsweise der Wert 0 oder 1 zugeordnet werden. Auf diese Weise wird 
codiert, ob eine Antwortmöglichkeit angekreuzt wurde oder nicht (Multiple 
Dichotomien-Methode; vgl. ebd.). In einigen computerbasierten Analysepro- 
grammen wie SPSS (SPSS inc./IBM 2012) gibt es außerdem die Möglichkeit, 
Mehrfachantwortsets zu definieren. 


2.2 Das qualitative Interview 


Eine andere, häufig verwendete Erhebungsmethode in den Sozialwissenschaf- 
ten ist das Interview. Dieses wird üblicherweise der qualitativen Forschungs- 
methodik zugeordnet, weshalb es im Rahmen dieses Beitrags als Beispiel 
für qualitative Befragungsmethoden ausgewählt wurde. Es existieren dabei 
unterschiedliche Interviewvarianten, wie etwa das narrative Interview, das 
ethnografische Interview, das rezeptive Interview, das problemzentrierte In- 
terview, das fokussierte Interview, das episodische Interview, das themenzen- 
trierte Interview, das personenzentrierte Interview, das systemische Interview, 
das halbstrukturierte Interview oder das Experteninterview (Mey/Mruck 
2011: 423ff.). Die Interviewformen unterscheiden sich in ihrem Standardi- 
sierungs- und Strukturiertheitsgrad und sind teilweise leitfadenbasiert oder 
folgen vorformulierten Fragen. Des Weiteren können Interviews anhand der 
„evozierten Textsorte (Erzählung, Bericht, Argumentation, Sachdarstellung, 
Kenndaten, Meinungen, etc.) geordnet werden“ (ebd.: 428). Welches Verfah- 
ren im Einzelnen ausgewählt wird, ist abhängig von Forschungsinteresse und 
Anwendungsbereich. 
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Üblicherweise wird ein Interview von einem Interviewer mit einer zu in- 
terviewenden Person durchgeführt. Interviews können synchron (face-to-face; 
telefonisch) oder asynchron (z.B. E-Mail-Interview) durchgeführt werden. Der 
Interviewer stellt die je nach gewählter Methode zugehörigen Fragen, die Ant- 
worten werden meist aufgezeichnet. Dies kann beispielsweise per Audioauf- 
zeichnung, Videoaufzeichnung oder Mitschrift (Notizen/Protokoll) erfolgen 
(z.B. Konrad 2011). Die so gewonnenen Daten müssen danach entsprechend 
ausgewertet und ggf. codiert werden. Eine für die Quantifizierung von qualitati- 
ven Befragungsdaten gut geeignete Methode ist hier beispielsweise die qualitative 
Inhaltsanalyse (Mayring 2011: 602): „Sind mit diesen Verfahren Zuordnungen 
von Kategorien zum Textmaterial regelgeleitet vorgenommen worden, so lassen 
sie sich gegebenenfalls auch quantitativ [...] weiterverarbeiten. Deshalb nimmt 
die qualitative Inhaltsanalyse im (wenig produktiven) Streit um qualitative oder 
quantitative Methoden eine gewissen Zwischenstellung ein“. 


2.2.1 Itemformate 


Typisch für qualitative Befragungsformen sind offene Antwortformate. Bei der 
mündlichen Befragung können, je nach Strukturiertheits- und Standardisiert- 
heitsgrad der gewählten Interviewform, die befragten Personen demnach mehr 
oder weniger frei auf die durch den Interviewer gestellten Fragen antworten. 
Denkbare Varianten von Item- bzw. Antwortformaten sind dabei eine vollstän- 
dig offene Antwort, das Auswählen verschiedener mündlich vorgegebener Ant- 
wortmöglichkeiten, oder aber auch diverse Zwischenformen. 


2.2.2 Kategorisierung und Codierung qualitativer Interviews 


Die Antworten im Rahmen eines mündlichen Interviews werden häufig als Ton- 
oder Videomitschnitt festgehalten, welcher dann vor der Auswertung transkribiert 
wird. Die Transkription sollte dabei regelgeleitet erfolgen (vgl. auch Konrad 2011: 
47). Ziel der Auswertung ist meist eine Verdichtung des Textes bzw. der darin ent- 
haltenen Aussagen. Dabei kann auch die Auswertung von Interviews mehr oder 
weniger standardisiert erfolgen (z.B. Schmidt-Atzert/Amelang 2012: 325). Da die 
Auswertung von offenen Antworten im Rahmen eines Interviews häufig kompli- 
ziert und mit größerem Aufwand verbunden ist, werden oft Kategorien festgelegt, 
anhand derer ein Interview systematisch ausgewertet wird. Eine solche Katego- 
risierung ermöglicht eine Vergleichbarkeit der Antworten, beispielsweise von 
unterschiedlichen Gruppen oder zu unterschiedlichen Zeitpunkten (vgl. Konrad 
2011: 50). Die Kategorisierung kann sowohl vor als auch nach der Durchführung 
des Interviews erfolgen, und stellt oft einen separaten Auswertungsschritt dar. 
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Eine häufig angewandte Auswertungsmethode ist die Inhaltsanalyse, die 
sich in Verfahren zur Zusammenfassung, Explikation, und Strukturierung un- 
terteilen lässt (z.B. Konrad 2011: 47f.). Beispielsweise bei der unter 2.2 bereits 
kurz angesprochenen qualitativen Inhaltsanalyse von Mayring (z.B. 2008, 2011) 
„geht es darum, diese Grundformen des Interpretierens von Text mit inhalts- 
analytischen Regeln beschreibbar und überprüfbar werden zu lassen“ (Mayring 
2011: 602). Von besonderer Relevanz für die Inhaltsanalyse ist dabei das Ka- 
tegoriensystem: „Kategorien stellen die Auswertungsaspekte in Kurzform dar 
[...]. Die Kategorien müssen jedoch in der Inhaltsanalyse genau definiert und 
mit inhaltsanalytischen Regeln muss die Zuordnung zum Text festgelegt werden 
[...]. Dies geschieht in der Regel theoriegeleitet, bei deduktiven Kategorienan- 
wendungen explizit durch die vorab festgelegte Definition der Kategorien, bei 
induktiver Kategorienbildung durch die Gruppierung der induktiven Katego- 
rien zu Hauptkategorien“ (ebd.: 603). Wird etwa die Vorkommenshäufigkeit 
solcher Kategorien analysiert, dann kann auch eine quantitative Datenanalyse 
erfolgen. 

Ein relevanter Auswertungsschritt ist dementsprechend die Festlegung von 
Analyse- und Kodiereinheit (vgl. Konrad 2011: 49). Dabei muss festgelegt wer- 
den, welche Textstücke genau auf ihre Einordnung in eine Kategorie, bzw. auf 
das Vorhandensein und ggf. die Ausprägung des interessierenden Merkmals hin 
überprüft werden sollen. Konrad (2011: 49) nennt bezüglich der Analyse des 
Materials drei Aufgaben des/der Forschers/in: die Definition von Kategorien, die 
Anführung von Ankerbeispielen, und die Festlegung von Kodierregeln. Basie- 
rend auf der so erfolgten Auswertung und Codierung des Interviews folgt dann 
die Interpretation der Ergebnisse. Ein weiterer, dem vorgeschalteter Schritt kann 
jedoch auch in der statistischen Auswertung und der dazu notwendigen Quan- 
tifizierung der Daten liegen. 


2.2.3 Quantifizierung qualitativer Daten 


Eine Quantifizierung qualitativer Daten bedeutet, dass die „statistische Weiter- 
verarbeitung es erforderlich macht, dass sie in numerische Variablen übersetzt 
werden“ (Kempf 2010: 1). Zweck einer solchen Quantifizierung ist es häufig, 
das Gemeinsame über mehrere Interviews hinweg herauszuarbeiten. Zu diesem 
Zweck erfolgt üblicherweise vor der Quantifizierung die oben bereits erwähnte 
Kategorisierung zur Verdichtung der Informationen. Die weiteren Auswertun- 
gen und die Quantifizierung der Daten erfolgen bei Interviews meist basierend 
auf einer Transkription. Um das oben verwendete Beispiel der wahrgenomme- 
nen muttersprachlichen Kompetenz wieder aufzugreifen, könnte beispielsweise 
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zunächst einmal von Interesse sein, welche sprachlichen Teilkompetenzen oder 
welche sprachlichen Handlungen von den Befragten überhaupt wahrgenom- 
men und als wichtig für die allgemeine muttersprachliche Kompetenz erach- 
tet werden. Aufgrund von diesbezüglichen Aussagen können dann Kategorien 
gebildet werden, wie beispielsweise „Verstehen von Gesprochenem‘“, „Lesen 
von Tageszeitungen‘, „Sprechen“, etc. Denkbar ist natürlich auch eine Festle- 
gung der Kategorien auf theoretischer Basis bereits vor der Durchführung des 
Interviews. 

Wurden die Kategorien festgelegt, kann nun zunächst einfach gezählt werden, 
wie häufig eine bestimmte Kategorie insgesamt gewählt wurde. Hier besteht die 
Quantifizierung der Daten also in der Erhebung der Häufigkeiten. Dies ist be- 
reits eine wichtige Information, kann sie doch dem/der Forscher/in einen Ein- 
druck vermitteln, ob die gewählten Kategorien für die Befragten tatsächlich von 
Belang sind und welche der Kategorien bzw. welche der sprachlichen Teilkompe- 
tenzen die größte oder geringste Relevanz aufweisen. Ferner können, basierend 
auf diesen Ergebnissen, die Kategorien auch überarbeitet, ergänzt oder adaptiert 
und dann erneut ausgezählt werden. 

Diese relativ basalen Informationen können bereits von inhaltlicher Relevanz 
sein. Bezogen auf das Sprachkompetenz-Beispiel wären möglicherweise didak- 
tische Implikationen für die Gestaltung des muttersprachlichen Unterrichts 
denkbar, etwa wenn durch die Häufigkeit der Nennungen der einzelnen wahr- 
genommenen Sprachkompetenzen ersichtlich wird, dass eigentlich sprachlich 
hoch relevante Teilkompetenzen von den Befragten gar nicht als relevant wahr- 
genommen werden und deren expliziterer Einbezug in den Unterricht daher 
möglicherweise sinnvoll wäre. 

Neben der Erhebung von einfachen Häufigkeiten ist es, je nach Merkmal, 
auch möglich, die gewählten Kategorien weiter zu unterteilen. Oft ist dies sinn- 
voll, wenn neben dem bloßen Vorkommen außerdem der Ausprägungsgrad 
eines Merkmals interessiert. Bezogen auf das Beispiel wäre hier eine Abstufung 
des interessierenden Merkmals, etwa der sprachlichen Teilkompetenz „wahrge- 
nommenes Hörverstehen‘, in unterschiedliche Kompetenzstufen! denkbar. In 
diesem Fall würden für eine Quantifizierung der Daten den unterschiedlichen 
Kompetenzstufen einer sprachlichen Teilkompetenz unterschiedliche Zahlen 
zugeordnet, beispielsweise der niedrigsten Stufe die Zahl 1 und der höchsten die 


1 Hier sind dabei nicht empirisch gebildete Kompetenzstufen im Rahmen einer Kom- 
petenzmodellierung gemeint, sondern eine Einordnung von Antworten in theoretisch 
angenommene Fähigkeitsniveaus. 
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Zahl 6. Auf diese Art und Weise kann die im Interview enthaltene Information 
verdichtet, quantifiziert und statistisch ausgewertet werden. 


2.2.4 Das Skalenniveau 


Sind qualitative Daten quantifiziert, können prinzipiell, je nach Skalenniveau, die 
gleichen Auswertungsmethoden herangezogen werden wie bei Daten, die anhand 
quantitativer Methoden gewonnen wurden. Welche statistischen Auswertungs- 
methoden genau gewählt werden können und sollten, hängt zum einen mit der 
Art der Forschungsfrage und der damit einhergehenden Hypothese zusammen 
(z.B. Zusammenhangshypothese oder Unterschiedshypothese). Zum anderen legt 
das Skalenniveau der Daten fest, welche Verfahren überhaupt zulässig sind. So 
setzen viele Verfahren der deskriptiven Statistik sowie der Inferenzstatistik min- 
destens Intervallskalenniveau voraus. Sind beispielsweise bei der Kategorisierung 
mehrere Abstufungen gewählt worden, anhand derer eine mehr oder weniger 
starke Ausprägung des gemessenen Merkmals codiert wird, kann hier, genauso 
wie bei den anhand quantitativer Methoden erhobenen Daten, zumindest von ei- 
nem Ordinalskalenniveau ausgegangen werden. Im Prinzip ist auch eine Einord- 
nung auf Intervallskalenniveau möglich, nämlich dann, wenn theoretisch davon 
ausgegangen wird, dass die einzelnen Abstufungen des Merkmals die gleichen 
Abstände besitzen. Auf die Frage, welche Analyseverfahren für welche Skalenni- 
veaus zulässig sind, wird im folgenden Teil des Kapitels näher eingegangen. 


3. Computerbasierte Datenanalyse am Beispiel von SPSS 


In diesem Teil des Kapitels soll am Beispiel des Analyseprogramms SPSS (IBM 
SPSS Statistics, derzeit Version 22; SPSS inc./IBM 2014) auf die computerbasier- 
te Auswertung empirischer Daten eingegangen werden. Prinzipiell sind alle be- 
schriebenen Analysen jedoch auch mit anderen Programmen wie beispielsweise 
der Open-Source-Software R (http://www.r-project.org) durchführbar. Bei SPSS 
handelt es sich um eine der gängigsten Statistik- und Datenanalyse-Software 
(z.B. Janssen/Laatz 2013). SPSS ist ein proprietäres Programm und prinzipiell 
für unterschiedliche Betriebssysteme wie Windows, Linux oder MacOS erhält- 
lich. Das Programm ist modular aufgebaut; zusätzlich zur Basissoftware, welche 
die gängigsten statistischen Auswertungsverfahren enthält, existieren speziel- 
le Softwaremodule, die jedoch für das vorliegende Kapitel nicht von Relevanz 
sind. In SPSS können die Befehle entweder über Dropdown-Menüs oder aber 
per Syntax eingegeben werden. Im vorliegenden Kapitel wird ausschließlich auf 
die Verwendung der Menüs eingegangen, zur Verwendung von Syntax wird an 
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dieser Stelle auf entsprechende Fachliteratur (z.B. Brosius 2013, Janssen/Laatz 
2013) verwiesen. 


3.1 Grundlagen 


Die Verwendung von SPSS setzt für den größten Teil der Analysemethoden 
eine Quantifizierung aller Daten voraus. Das bedeutet, um SPSS für eine ge- 
meinsame Auswertung der anhand von qualitativen und quantitativen Erhe- 
bungsmethoden gewonnenen Daten nutzen zu können, müssen - wie oben 
beschrieben - allen Merkmalen, Merkmalsausprägungen und Kategorien 
Zahlen zugeordnet werden. Sind die Daten einmal erhoben und quantifiziert, 
müssen sie zunächst in die SPSS-Datenmatrix eingegeben und gegebenenfalls 
für die Analyse vorbereitet werden. Das Programm verfügt dazu über zwei un- 
terschiedliche Ansichten: die Variablenansicht und die Datenansicht (Abb. 1). 
Üblicherweise werden bei der Erstellung der Datenmatrix zunächst in der 
Variablenansicht alle Variablen definiert sowie deren Eigenschaften festge- 
legt. Hier können unter anderem der Name der Variablen, der Variablentyp 
(beispielsweise numerisch oder String), das Variablenlabel, sowie Wertelabels 
(d.h. welche Ausprägung einer Variablen wurde mit welcher Zahl codiert?) 
festgelegt werden. Pro Frage (Fragebogen) bzw. Kategorie (Interview) wird 
eine Variable definiert. Ist diese Definition der Datenmaske erfolgt, werden 
im nächsten Schritt die Daten in der Datenansicht eingegeben. Dort stellt jede 
Spalte eine der zuvor definierten Variablen dar, und jede Zeile einen Fall, das 
heißt beispielsweise eine befragte Person. In den einzelnen Zellen sind somit 
die Probandenrohwerte abgetragen, d.h. jeweils die Antwort einer einzelnen 
Person auf ein einzelnes Item. 

Ist die Dateneingabe erfolgt, ist es oft notwendig, vor der Durchführung der 
geplanten Analysen die Daten weiter aufzubereiten. Das beinhaltet häufig die 
Umcodierung von bereits eingegebenen Daten. Eine solche Umcodierung könnte 
etwa dann notwendig sein, wenn eine Frage im Fragebogen nicht so formuliert 
wurde, dass eine stärkere Zustimmung zu einer Aussage auch tatsächlich mit 
einer höheren Ausprägung des Merkmals einhergeht, d.h. wenn zur Erfassung 
eines Merkmals sowohl positiv als auch negativ formulierte Items eingesetzt 
wurden. Ein weiterer Grund für eine Umcodierung kann die Entscheidung sein, 
aus theoretischen Gründen bestimmte Variablenausprägungen zusammenzufas- 
sen und diesen den gleichen Zahlenwert zuzuordnen (Beispiel: Festlegung be- 
stimmter Altersgruppen, Zusammenfassen von Berufsgruppen, Sprachgruppen 
etc.). Eine solche Umcodierung kann in SPSS jederzeit relativ unproblematisch 
über das Menü Transformieren und eines der Untermenüs Umcodieren erfolgen. 
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Abb. 1: Datenstruktur in SPSS (Datenansicht; Screenshot); Daten entnommen aus dem 
SPSS Beispieldatensatz „GSS93“. 
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Eine weitere, häufig notwendige Maßnahme vor weiteren Datenanalysen ist das 
Berechnen von neuen Variablen. Dies kann etwa dann notwendig werden, wenn 
aus unterschiedlichen Items, die das gleiche Konstrukt erfassen sollen (beispiels- 
weise die muttersprachliche Lesekompetenz), ein Gesamttestwert gebildet wer- 
den soll. Dies kann über den Menüpunkt Transformieren und das Untermenü 
Variable berechnen erfolgen. Dort können aus bestehenden Variablen neue er- 
rechnet werden, wie beispielsweise ein Gesamttestwert mittels einer einfachen 
Addition derjenigen Variablen, die zu diesem Wert beitragen sollen. Die neue 
Variable erscheint nach Abschluss der Berechnung in der Datenmatrix und kann 
für weitere Analysen verwendet werden. 

In SPSS erfolgen die Angaben sämtlicher durchgeführter Aktionen sowie die 
Darstellung der Analyseergebnisse im sogenannten Ausgabefenster. Dieses wird au- 
tomatisch vom Programm erstellt und geöffnet, etwa wenn eine Datei zum ersten 
Mal in der Sitzung geöffnet oder eine neue Datei gespeichert wird. Der Inhalt des 
Ausgabefensters muss separat gespeichert werden und kann in unterschiedliche 
Formate exportiert werden. Ist die Datenaufbereitung abgeschlossen, können die 
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ersten Auswertungen erfolgen. Welche Verfahren jeweils anzuwenden sind, ist ab- 
hängig von Fragestellung und Hypothese (z.B. Unterschiedshypothese, Zusammen- 
hangshypothese), dem Skalenniveau der Daten, sowie der Stichprobengröße (n). 


3.2 Datenauswertung 
3.2.1 Erste Auswertungsschritte 


In einem ersten Schritt werden üblicherweise die Häufigkeitsverteilungen sowie 
die deskriptiven Statistiken der interessierenden Variablen betrachtet. Hierzu 
zählen Maße der zentralen Tendenz (Mittelwert/arithmetisches Mittel, Median, 
Modalwert) und Dispersionsmaße (Varianz, Standardabweichung, Minimum, 
Maximum, Range). 

Häufigkeiten bzw. Häufigkeitsverteilungen sowie unterschiedliche dazuge- 
hörige Diagramme können in SPSS über den Menüpunkt Analysieren und dort 
über die Untermenüs Deskriptive Statistiken und Häufigkeiten angefordert wer- 
den. Am Ergebnis ist beispielsweise abzulesen, wie häufig welche Antwort be- 
züglich eines Items gewählt wurde, oder wie häufig eine bestimmte Gruppe in 
der Stichprobe vertreten ist (z.B. Männer, Frauen; siehe Tabelle 1). 

Die Analyse der deskriptiven Statistiken erfolgt über die Menüpunkte Analysieren- 
Deskriptive Statistiken - deskriptive Statistik (Tabelle 2), oder aber über Analysieren - 
Deskriptive Statistiken - Explorative Datenanalyse. Des Weiteren existiert auch im 
Rahmen der meisten inferenzstatistischen Auswertungsverfahren in SPSS die Mög- 
lichkeit, diese Kennwerte mit ausgeben zu lassen. Mithilfe der deskriptiven Statisti- 
ken ist es möglich, erste Kenntnisse über die Verteilung der Daten zu erlangen. So 
lässt sich eine Aussage darüber machen, ob die Verteilung eher breit- oder schmal- 
gipflig ist (Kurtosis), ob sie beispielsweise linksschief und rechtssteil ist (Schiefe) 
oder symmetrisch. Die Verteilungsform ist von großer Relevanz, da sie Einfluss auf 
weitere Auswertungen haben kann. Ist die Varianz beispielsweise sehr klein, da die 
getesteten Personen sich im Hinblick auf das gemessene Merkmal kaum unterschei- 
den, dann kann dies u.a. zu einer niedrigeren Korrelation mit anderen Variablen 
führen (Varianzeinschränkung; z.B. Schmidt-Atzert/Amelang 2012: 10). 


Tabelle 1: Häufigkeiten der Variablen „Geschlecht“ (Ausprägungen: männlich/weiblich) 


Häufigkeit | Prozent | Gültige Kumulierte 
Prozente | Prozente 


Gültig | männlich 37 | 49,333 | 49,333 49,333 
| weiblich 38 | 50,667 | 50,667 100 
| Gesamt 75 100 100 100 
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Tabelle 2: Deskriptive Statistiken der Variablen „muttersprachliche Kompetenz“ und „wahrgenommene 
muttersprachliche Kompetenz“ 


N | Minimum | Maximum | Mittelwert Standard- 
abweichung 
Muttersprachliche | 75 15 | 49 | 33,50 5,3 
Kompetenz ' 
Wahrgenommene 75 1 5 3,01 0,9 
muttersprachliche 
Kompetenz ? 


1 Max. Wert = 50 Punkte 
2 Angenommene Intervallskalierung des Merkmals 


Wie bereits erwähnt, setzen außerdem viele der gängigen Analyseverfahren 
eine Normalverteilung (NV) der Daten voraus. Die Normalverteilung (Abb. 2) 
zeichnet sich dadurch aus, dass sich die Daten symmetrisch und glockenförmig 
verteilen. Des Weiteren sind in dem Bereich +/- 1 Standardabweichung vom Mit- 
telwert ca. 68% der Messwerte zu finden, und +/-2 Standardabweichungen vom 
Mittelwert ca. 95,5% (z.B. Rasch et al. 2006: 32). 

In SPSS können Daten daraufhin überprüft werden, ob sie hinsichtlich ihrer 
Verteilung statistisch signifikant von einer Normalverteilung abweichen. Dies 
erfolgt mithilfe eines sogenannten statistischen Tests. Für statistische Analysen 
gilt allgemein Folgendes: 


Abb. 2: Normalverteilung. 
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Ziel in der „Inferenzstatistik“ (oder auch „schließenden Statistik“) ist das Ziehen 
von Rückschlüssen von Stichprobendaten auf eine entsprechende (unbekannte, 
da nicht komplett erhobene) Population. Bezogen auf unser Beispiel könnte etwa 
von Interesse sein, ob sich Männer und Frauen hinsichtlich der Wahrnehmung 
ihrer muttersprachlichen Kompetenz unterscheiden (Unterschiedshypothese). 
Ferner wird angenommen, dass die Frauen ihre Kompetenz signifikant höher 
einschätzen als es bei den Männern der Fall ist. Es handelt sich hier also um eine 
gerichtete Hypothese, da Annahmen bezüglich der Richtung des Unterschieds 
getätigt werden. Existieren solche Annahmen hingegen nicht, handelt es sich um 
eine ungerichtete Hypothese. 

Als nächstes wird diese wissenschaftliche Hypothese in eine sogenannte statis- 
tische Hypothese überführt (Bortz/Schuster 2010: 98). Die Nullhypothese (H0) 
postuliert dabei, dass in der Population kein Unterschied zwischen den beiden 
Mittelwerten der beiden Gruppen (genauer: zwischen den Populationsmittelwer- 
ten, bezeichnet als u1 und u2) existiert. Dies wird formal ausgedrückt als ul= u2. 
Die sogenannte Alternativhypothese (H1) hingegen drückt aus, dass ein Unter- 
schied zwischen den beiden Populationsmittelwerten existiert (gerichtet: ul< u2 
oder ul>wu2; ungerichtet: ul#4u2). Es wird nun -möglichst basierend auf einer re- 
präsentativen Stichproben- mithilfe statistischer Tests überprüft, welche der bei- 
den Hypothesen bestätigt bzw. zurückgewiesen werden soll. Dies geschieht, indem 
„die Vereinbarkeit der Nullhypothese mit der Empirie“ überprüft wird (ebd.: 99). 

Die Überprüfung statistischer Hypothesen erfolgt mithilfe der Berechnung 
einer sogenannten Prüfgröße (z.B. p, F T je nach angenommener Verteilung der 
Daten; gewonnen aus den empirisch erhobenen Stichprobendaten), die mit ei- 
nem sog. „kritischen Wert“ abgeglichen werden. Der jeweils zu verwendende 
kritische Wert kann anhand spezieller Tabellen (z.B. in Rasch et al. 2006: 194ff.) 
abgelesen werden. Üblicherweise gilt: Überschreitet die Prüfgröße den kriti- 
schen Wert, ist von einer statistischen Signifikanz auszugehen, die Nullhypothe- 
se (H0) wird verworfen und die Alternativhypothese (Hl) angenommen. Der 
in SPSS mit „Signifikanz“ bezeichnete Wert gibt die Wahrscheinlichkeit an, mit 
der ein Fehler begangen wird, wenn die Nullhypothese verworfen wird. Konven- 
tionell wird bei einem Signifikanz-Wert kleiner als 0,05 von einem statistisch 
relevanten Ergebnis ausgegangen, da so davon ausgegangen werden kann, dass 
in maximal 5% der Fälle ein Fehler gemacht wird, wenn die H0 verworfen und 
die H1 angenommen wird.” 


2 Im Rahmen des Hypothesentestens wird von zwei möglichen Fehlerarten ausgegan- 
gen: „Ein Fehler 1. Art wird begangen, wenn eine richtige Nullhypothese zugunsten 
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Die Überprüfung von Daten auf Normalverteilung erfolgt nun in SPSS über 
das Menü Analysieren -Deskriptive Statistiken - Explorative Datenanalyse. In dem 
dann geöffneten Auswahlfeld muss nach der Auswahl der zu analysierenden Va- 
riablen der Button Diagramme angeklickt, und dann ein Häkchen bei Normal- 
verteilungsdiagramm mit Test gesetzt werden. Die Ergebnisausgabe beinhaltet 
dann neben den deskriptiven Statistiken auch Tests auf Normalverteilung: den 
Kolmogorov-Smirnoff-Test, sowie den Shapiro-Wilks-Test bei n<50. Für die 
schnelle Interpretation ist hier vor allem der Wert in der Tabellenspalte Signi- 
fikanz von Interesse: Ist dieser kleiner als 0,05, dann weicht die Verteilung sig- 
nifikant von der Normalverteilung ab. Anders ausgedrückt: Die Nullhypothese, 
dass die Daten nicht von einer Normalverteilung abweichen, wird zurückgewie- 
sen und somit die Alternativhypothese H1 angenommen. Bezüglich der Inter- 
pretation der übrigen von SPSS ausgegebenen Werte wird aus Platzgründen auf 
entsprechende Standardwerke (z.B. Janssen/Laatz 2013) verwiesen. Sind die Da- 
ten nicht normalverteilt, können teilweise sogenannte nichtparametrische Tests 
zum Einsatz kommen, auf die an dieser Stelle jedoch nicht näher eingegangen 
werden soll. 


3.2.2 Überprüfung von Zusammenhangshypothesen 


Häufig beinhalten wissenschaftliche Fragestellungen die Frage nach dem Zu- 
sammenhang zwischen zwei Variablen. Eine auf unser Beispiel bezogene Fra- 
gestellung wäre etwa „Existiert ein (statistisch signifikanter) Zusammenhang 
zwischen der wahrgenommenen und der (per Test erfassten) tatsächlichen 
muttersprachlichen Kompetenz?“ Eines der zur Bearbeitung solcher Frage- 
stellungen am häufigsten eingesetzten Analyseverfahren ist die Korrelation. 
Hier ist zunächst zu unterscheiden zwischen der bivariaten und der multip- 
len Korrelation: Erstere betrachtet den Zusammenhang zwischen zwei (inter- 
vallskalierten) Variablen, letztere den simultanen Zusammenhang von einer 
Variablen mit mehreren anderen. Des Weiteren existieren, je nach Skalenni- 
veau der in die Analyse einbezogenen Daten, unterschiedliche Korrelations- 
koeffizienten. Sind die Daten mindestens auf Intervallskalenniveau und in 
der Grundgesamtheit normalverteilt, dann wird üblicherweise der Pearson 
Produkt-Moment-Korrelationskoeffizient (r) verwendet. Sind diese Voraus- 
setzungen nicht gegeben, kann ein Rangkorrelationskoeffizient (r,) verwendet 


der Alternativhypothese abgelehnt wird. Ein Fehler 2. Art wird begangen, wenn eine 
falsche Nullhypothese beibehalten wird“ (Bortz/Schuster 2010: 100). Die Fehler wer- 
den auch als alpha- und beta-Fehler bezeichnet. 
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werden. Bei SPSS stehen hier für ordinalskalierte Variablen der Spearman- 
Koeffizient (r ) sowie Kendall’s Tau-b (T,) zur Verfügung (z.B. Brosius 2013). 

Korrelationskoeffizienten können generell Werte zwischen 1 und -1 anneh- 
men. Dabei gilt: Je näher sich der Wert an Null befindet, desto geringer ist der 
(lineare) Zusammenhang (z.B. Bortz/Schuster 2010: 125). Dementsprechend 
bedeutet ein Wert von Null, dass kein linearer Zusammenhang zwischen den 
Variablen besteht. Je näher der Wert hingegen an 1 oder -1 liegt, desto größer ist 
der lineare Zusammenhang zwischen zwei Variablen (r = 1 bzw. r = —1: perfekter 
linearer Zusammenhang). 

Ein positiver Korrelationskoeffizient lässt sich dabei inhaltlich so interpre- 
tieren, dass größere Werte auf der einen Variablen systematisch mit größeren 
Werten auf der anderen Variablen einhergehen („je mehr desto mehr“; zur Her- 
leitung und Berechnung des Korrelationskoeffizienten siehe z.B. Rasch et al. 
2006: 125ff.). Bezogen auf unser Beispiel könnte ein positiver Koeffizient von 
r = 0,7 etwa bedeuten, dass eine hohe wahrgenommene muttersprachliche Kom- 
petenz relativ systematisch mit einer hohen getesteten muttersprachlichen Kom- 
petenz einhergeht. Ein negativer Koeffizient bedeutet hingegen, dass ein hoher 
Wert auf der einen Variablen systematisch mit einem niedrigen Wert auf der 
anderen Variablen einhergeht („je mehr desto weniger“). Bei der inhaltlichen 
Interpretation von Korrelationen ist zu beachten, dass diese nicht kausal inter- 
pretiert werden dürfen, da keine Aussage über die Richtung eines Zusammen- 
hangs gemacht werden kann. Es wird lediglich ausgesagt, dass ein mehr oder 
weniger starker linearer Zusammenhang zwischen zwei Variablen existiert bzw. 
nicht existiert. Bezüglich der Interpretation gibt z.B. Brosius (1998) als Orientie- 
rungshilfe an, dass Koeffizienten zwischen r = 0 und r = 0,2 als sehr schwache 
Korrelation, r = 0,2 und r = 0,4 als schwache Korrelation, zwischen r = 0,4 und 
r = 0,6 als mittlere, und darüber hinaus als starke bzw. sehr starke Korrelation zu 
interpretieren sind. 

Ein erster Eindruck bezüglich der Stärke des linearen Zusammenhangs kann 
außerdem über die Erstellung eines Streudiagramms (Abb. 3) gewonnen wer- 
den. Dort werden für jede Person bzw. für jeden Fall anhand eines Punktes die 
Werte der beiden erfassten Variablen auf der x- und y- Achse eines Koordina- 
tensystems abgetragen. Ein perfekter Zusammenhang würde sich nun dadurch 
zeigen, dass alle Punkte perfekt auf einer 90°-Geraden liegen, deren Richtung 
wiederum anzeigt, ob es sich dabei um einen positiven, oder um einen negativen 
Zusammenhang handelt (Gerade von unten links nach oben rechts: positiver 
Zusammenhang; von oben links nach unten rechts: negativer Zusammenhang). 
Je näher die Punkte nun um diese Gerade streuen, desto größer ist der line- 
are Zusammenhang. Ein solches Diagramm kann in SPSS beispielsweise über 
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den Menüpunkt Diagramme -veraltete Dialogfelder - Streu-/Punkt-Diagramm 
erstellt werden. 


Abb. 3: Beispiel Streudiagramm, Darstellung des Zusammenhangs zwischen tatsächlicher 
und wahrgenommener muttersprachlicher Kompetenz (fiktive Daten). 


Muttersprachliche Kompetenz 


Wahrgenommene muttersprachliche Kompetenz 


Beispiel: Positiver Zusammenhang zwischen wahrgenommenen und 
tatsächlichen muttersprachlichen Kompetenzen (fiktives Beispiel) 


Die Berechnung der Korrelationskoeffizienten an sich erfolgt in SPSS über die 
Menüpunkte Analysieren - Korrelation - bivariate Korrelation. In dem dann 
geöffneten Dialogfeld können die interessierenden Variablen sowie die zu ver- 
wendenden Korrelationskoeffizienten gewählt werden. Prinzipiell ist es mög- 
lich, gleichzeitig die Korrelationen zwischen mehreren Variablen berechnen zu 
lassen. Es sollte jedoch bedacht werden, dass bei einer größeren Anzahl von 
Variablen die im Ausgabefenster erstellte Korrelationstabelle schnell unüber- 
sichtlich wird. 

Im Ausgabefenster wird dann eine Tabelle (Korrelationstabelle, siehe Tabelle 3) 
erzeugt, welche die bivariate Korrelation jeder Variablen mit jeder anderen ge- 
wählten Variablen anzeigt. In den daraus resultierenden Zellen wird jeweils die 
Größe des Korrelationskoeffizienten als Maß für die Stärke des Zusammenhangs 
zweier Variablen angegeben, der Signifikanz-Wert p, sowie die Anzahl der zur 
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Berechnung verwendeten Fälle. Auch hier gibt der Signifikanz-Wert Auskunft 
darüber, ob ein Zusammenhang statistisch signifikant ist: Ist dieser Wert kleiner 
als 0,05 (p < 0,05), dann wird die Null-Hypothese „Es besteht kein (statistisch 
signifikanter) Zusammenhang“ zurückgewiesen und die Hl „Es besteht ein (sta- 
tistisch signifikanter) Zusammenhang“ angenommen. 


Tabelle 3: Korrelationen zwischen den Variablen „muttersprachliche Kompetenz“ und „wahrgenommene 
muttersprachliche Kompetenz“ 


Muttersprachliche Wahrgenommene 
Kompetenz Muttersprachliche 
Kompetenz 
Muttersprachliche | Korrelation nach Pearson 1 W 
Kompetenz Signifikanz (2-seitig) ,023 
N 75 75 
Wahrgenommene | Korrelation nach Pearson E i 1 
Muttersprachliche | Signifikanz (2-seitig) ‚023 
Kompetenz N 75 75 


*. Die Korrelation ist auf dem Niveau von 0,05 (2-seitig) signifikant. 
** Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant. 
N = Anzahl der Personen 


Neben der bivariaten Korrelation existieren noch weitere Möglichkeiten, Zusam- 
menhänge zwischen Daten zu untersuchen. Möchte man beispielsweise über- 
prüfen, ob es einen Zusammenhang zwischen zwei nominalskalierten Variablen 
(oder auch zwischen einer nominal- und einer ordinalskalierten Variablen) gibt, 
so kann dies mittels einer Kreuztabelle und dem Chi?-Test geschehen. Dabei wird 
abgeglichen, ob die beobachteten Häufigkeiten in den Zellen von den unter Un- 
abhängigkeit der Daten (d.h. unter der Annahme, dass kein Zusammenhang 
existiert) erwarteten Häufigkeiten signifikant abweichen. Für eine detailliertere 
Darstellung und Interpretation der Kreuztabelle wird auf Janssen/Laatz (2013) 
oder Brosius (2013) verwiesen. 

Die Erstellung der Kreuztabelle erfolgt in SPSS über die Menüpunkte 
deskriptive Statistiken - Kreuztabellen. Im folgenden Dialogfenster kann nun 
unter anderem festgelegt werden, welche Variablen in den Zeilen und wel- 
che in den Spalten der Tabelle erscheinen sollen. Des Weiteren kann unter 
Verwendung des Buttons „Statistiken“ gewählt werden, welche Zusammen- 
hangskoeffizienten (je nach Skalierung der Variablen) mit ausgegeben werden 
sollen. Neben dem Chi?-Test und dem Korrelationskoeffizienten handelt es 
sich dabei beispielsweise um den Kontingenzkoeffizienten für nominalska- 
lierte Variablen oder den bereits erwähnten Kendall’s Tau-b-Koeffizienten für 
ordinalskalierte Variablen. Der Chi?-Test gibt zwar an, ob ein Zusammenhang 
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signifikant ist, jedoch sagt er nichts über dessen Stärke aus. Daher sollte einer 
der genannten Koeffizienten mit hinzugezogen werden. Der in der Ergebnis- 
tabelle mit ausgegebene Signifikanz-Wert der Koeffizienten ist wie üblich zu 
interpretieren. 

Ein weiteres gängiges Analyseverfahren zum Betrachten von Zusammenhän- 
gen ist die (multiple) lineare Regression, die hier jedoch aus Platzgründen nur 
knapp dargestellt werden soll. In der sozialwissenschaftlichen Forschung gehört 
sie zu den am häufigsten verwendeten Analysemethoden (z.B. Bortz/Schuster 
2010) und wird üblicherweise verwendet, um den Zusammenhang zwischen 
einer abhängigen Variablen (Kriteriumsvariable) mit mehreren unabhängigen 
Variablen (Prädiktorvariablen) sowie deren jeweiligen Anteil (Regressionsge- 
wicht b bzw. standardisiertes Regressionsgewicht Beta) am Gesamtzusammen- 
hang zu untersuchen. Statistisch gesehen handelt es sich auch bei der bivariaten 
Korrelation um eine bivariate lineare Regression. 

Möchte man eine multiple lineare Regression in SPSS berechnen, erfolgt dies 
über die Menüpunkte Analysieren - Regression - linear. Im Ergebnisfenster werden 
dann unter anderem die Regressionskonstante a sowie die nicht-standardisierten 
und standardisierten Regressionsgewichte (b/Beta) ausgegeben. Des Weiteren 
erfolgen Angaben zur jeweiligen Irrtumswahrscheinlichkeit („Signifikanz“). 
Auch hier gilt: Ist dieser Signifikanzwert kleiner als 0,05, so kann davon aus- 
gegangen werden, dass die jeweilige Prädiktorvariable unter Berücksichtigung 
der übrigen ins Modell aufgenommenen Variablen signifikant zur Vorhersa- 
ge bzw. zur Erklärung der Kriteriumsvariablen beiträgt. Das Regressionsge- 
wicht wiederum gibt Auskunft über die relative Wichtigkeit der gewählten 
Prädiktorvariablen im Rahmen des gewählten Modells. Das Regressionsge- 
wicht (standardisiert/unstandardisiert) kann sowohl positiv als auch negativ 
sein. Auch hier gilt: Je näher der Wert an Null liegt, desto geringer ist der 
Zusammenhang. 

Bezogen auf unser Beispiel könnte etwa von Interesse sein, die muttersprach- 
liche Kompetenz (abhängige Variable oder Kriterium) mithilfe der unabhängi- 
gen Variablen (auch: Prädiktoren) „Alter in Jahren“ und „Aufenthaltsdauer im 
Herkunftsland (in Jahren) vor der Migration“ zu erklären. Für die Variable „Al- 
ter“ ergibt sich kein signifikantes positives Regressionsgewicht (p<0,05), für die 
Variable „Aufenthaltsdauer im Herkunftsland“ hingegen schon. In diesem Fall 
trägt also nur die Variable „Aufenthaltsdauer im Herkunftsland“ signifikant zur 
Erklärung der Unterschiedlichkeit von Personen (Varianz) bezüglich der mut- 
tersprachlichen Kompetenz bei, und es gilt: je länger der Aufenthalt im Her- 
kunftsland vor der Migration, desto besser die muttersprachliche Kompetenz 
(unter Kontrolle des Alters). 
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Wichtig ist außerdem zu beachten, dass sich die Regressionsgewichte je nach 
im Modell aufgenommenen Variablen ändern können. Dies ist darauf zurück- 
zuführen, dass bei der Berechnung der linearen Regression die Zusammenhän- 
ge zwischen zwei Prädiktorvariablen „herauspartialisiert“, d.h. herausgerechnet 
werden (dazu sowie zur Darstellung der Regressionsgleichung sowie der weiter- 
gehenden Interpretation siehe auch z.B. Rasch et al. 2006: 146ff; Bortz/Schus- 
ter 2010). Neben den Regressionsgewichten wird im Ergebnisfenster außerdem 
Auskunft darüber gegeben, wie gut das Gesamt-Modell „passt“, d.h. wie gut die 
gewählten Prädiktorvariablen dazu beitragen, das Kriterium zu „erklären“ oder 
„vorherzusagen“. 

Ziel ist, mithilfe der gewählten unabhängigen Variablen möglichst viel der 
Varianz der Kriteriumsvariablen (d.h. der Unterschiedlichkeit der Personen hin- 
sichtlich dieses Merkmals) zu erklären. Dazu wird der sogenannte Determinati- 
onskoeffizient R? herangezogen. Dieser gibt Auskunft darüber, welcher Anteil der 
Kriteriumsvarianz in einem Regressionsmodell insgesamt erklärt werden kann. 
R? liegt zwischen 0 und 1, wobei 1 bedeuten würde, dass die Varianz der Kriteri- 
umsvariablen perfektanhand der Prädiktorvariablen erklärt werden kann. So könn- 
te beispielsweise, bezogen auf unser Beispiel, ein R? von 0,4 so interpretiert werden, 
dass mithilfe der gewählten Prädiktorvariablen 40% der Kriteriumsvarianz erklärt 
werden kann, d.h. diese Variablen sind gemeinsam für 40% der Unterschiedlichkeit 
der Personen bezüglich des interessierenden Merkmals „verantwortlich“ Bezüg- 
lich der Interpretation aller weiteren im Ergebnisfenster dargestellten Werte sowie 
bezüglich der Berechnung und Interpretation der multiplen linearen Regression 
wird auf die oben bereits genannten Standardwerke verwiesen. 


3.2.3 Überprüfung von Unterschiedshypothesen 


Häufig beinhalten Forschungsfragen auch die Betrachtung von Gruppenunter- 
schieden. Meist handelt es sich dabei um die Frage, ob sich zwei oder mehr Grup- 
pen (im Mittel) statistisch signifikant hinsichtlich eines bestimmten Merkmals 
voneinander unterscheiden. Bezogen auf das oben verwendete Beispiel könnte 
etwa von Interesse sein, ob sich Jungen und Mädchen signifikant hinsichtlich 
ihrer wahrgenommenen muttersprachlichen Kompetenz unterscheiden. 


3 Weiterführende Analysen im Hinblick auf eine Überprüfung von Kausalitäten und/ 
oder Mediationseffekten sowie die Modellierung latenter Konstrukte können unter 
Anwendung fortgeschrittener statistischer Verfahren wie beispielsweise Strukturglei- 
chungsmodellen mithilfe der Software „MPlus“ (Muthen/Muthen 1998-2012) durch- 
geführt werden. 
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Ein sehr häufig für die Untersuchung von Gruppenunterschieden herange- 
zogenes inferenzstatistisches Verfahren ist der T-Test. Dieser setzt Intervallska- 
lenniveau und eine Normalverteilung der Daten voraus, ist jedoch gegenüber 
Verletzungen dieser Voraussetzungen gegenüber relativ robust (Bortz/Schuster 
2010) und auch bereits für kleinere Stichproben geeignet. Der T-Test ist für den 
Vergleich zweier Gruppenmittelwerte geeignet; je nach Messdesign verwendet 
man den T-Test für unabhängige oder für abhängige Gruppen (bzw. Stichpro- 
ben). Ersterer ist zur Betrachtung von sich gegenseitig ausschließenden Grup- 
pen geeignet (wie z.B. Jungen und Mädchen), letzterer beispielsweise für die 
Betrachtung ein- und derselben Gruppe zu zwei Messzeitpunkten, beispielswei- 
se vor und nach einer Intervention wie etwa einem Sprachtraining. 

In SPSS wird der T-Test über die Menüpunkte Analysieren - Mittelwerte ver- 
gleichen -T-Test für unabhängige/abhängige Stichproben durchgeführt. Im folgen- 
den Dialogfenster kann dann zunächst die Gruppierungsvariable (beispielsweise 
„Geschlecht“, unterteilt in die beiden Gruppen „Männer“ und „Frauen“) 
ausgewählt werden. Dabei ist zu beachten, dass unter dem Button Gruppen defi- 
nieren die verwendete Codierung angegeben werden muss (beispielsweise 1 und 2 
für den Fall, dass die beiden Ausprägungen der Variablen „Geschlecht“ anhand 
dieser Zahlenwerte codiert wurden). Im Feld Testvariablen werden diejenigen 
Variablen angegeben, die bezüglich eines möglichen Gruppenunterschieds 
betrachtet werden sollen. 

Im Ergebnisfenster werden zunächst einige Gruppenstatistiken wie die Grup- 
penmittelwerte angegeben. In der zweiten Ergebnistabelle wird außerdem zuerst 
ein Test auf Varianzgleichheit (Levene-Iest) der beiden Gruppen ausgegeben. 
Sind die Varianzen nicht gleich, ist der zum Levene-Test zugehörige Signifi- 
kanz-Wert kleiner als 0,05. Je nachdem ob die Varianzen gleich sind oder nicht, 
muss das Ergebnis des T-Iests in einer unterschiedlichen Zeile („Varianzen 
sind gleich“, bzw. „Varianzen sind nicht gleich“) abgelesen werden. Auch für den 
T-Test gilt: Ist der zugehörige Signifikanz-Wert kleiner 0,05, so unterscheiden 
sich die Gruppen statistisch signifikant. Ferner werden noch die mittlere Diffe- 
renz der Gruppen, der dazugehörige Standardfehler sowie das Konfidenzinter- 
vall der Differenz angegeben. 

Soll hingegen überprüft werden, ob sich mehrere Gruppen signifikant vonei- 
nander unterscheiden, und wenn ja, welche genau (bezogen auf unser Beispiel 
könnte etwa ein Vergleich unterschiedlicher Sprachgruppen bezüglich ihrer 
fremdsprachlichen Kompetenzen interessieren), dann kann diese Fragestellung 
anhand einer Varianzanalyse (sog. ANOVA: Analysis of Variance) bearbeitet 
werden. Aufgrund der Komplexität der Analysen kann die Varianzanalyse hier 
lediglich rudimentär dargestellt werden; bezüglich mathematischer Grundlagen 
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und einer weitergehenden Ergebnisinterpretation wird auf die entsprechende 
Fachliteratur (z.B. Bortz/Schuster 2010; Janssen/Laatz 2013) verwiesen. mithilfe 
der einfaktoriellen Varianzanalyse kann beispielsweise untersucht werden, ob 
sich Gruppen (in SPSS bezeichnet als Faktor) hinsichtlich eines Merkmals (ab- 
hängige Variable) unterscheiden. Dazu wird in einem ersten Schritt zunächst 
untersucht, ob über alle Gruppen hinweg ein Unterschied zu finden ist. 

In SPSS ist die Varianzanalyse unter den Menüpunkten Mittelwerte verglei- 
chen - einfaktorielle ANOVA zu finden. Im folgenden Dialogfenster muss nun 
angegeben werden, welche Variable die zu betrachtenden Gruppen codiert und 
beinhaltet (Faktor), und welche Variablen auf Gruppenunterschiede hin unter- 
sucht werden sollen (abhängige Variable). Im Ausgabefenster ist nun die Ta- 
belle „einfaktorielle ANOVA“ einzusehen. Diese beinhaltet neben Angaben zu 
den Quadratsummen innerhalb und zwischen den Gruppen und der Prüfgröße 
(dazu z.B. Bortz/Schuster, 2010) auch einen dazugehörigen Signifikanzwert, der 
zu interpretieren ist. Ist dieser Wert signifikant, dann ist dies ein Hinweis dar- 
auf, dass über alle Gruppen hinweg ein statistisch signifikanter Unterschied zu 
finden ist. 

Um welche Gruppen genau es sich dabei handelt, wird erst im Anschluss 
mithilfe sogenannter Post-hoc-Tests analysiert. Je nachdem ob Varianzgleichheit 
angenommen wird oder nicht (ein Test auf Varianzhomogenität ist zu finden 
unter dem Button „Optionen“) und in Abhängigkeit davon, ob die Stichpro- 
benumfänge gleich sind, existieren unter dem Button Post hoc verschiedene 
Auswahlmöglichkeiten. In der Ergebnis-Tabelle Mehrfachvergleiche ist dann 
einzusehen, zwischen welchen der Gruppen genau sich statistisch signifikante 
Unterschiede finden. Neben dem dafür relevanten Signifikanzwert finden sich 
in der Tabelle außerdem Angaben zur mittleren Differenz der Gruppen, Stan- 
dardfehler und Konfidenzintervall. 


3.2.4 Weitere Analysen 


Neben den im Rahmen des vorliegenden Kapitels dargestellten Verfahren kann 
mithilfe von SPSS noch eine Vielzahl weiterer Analysen durchgeführt werden. 
Diese beinhalten beispielsweise unter dem Punkt „Skalierung“ die Möglichkeit, 
die Reliabilität von Skalen zu berechnen. Auch können Analysen im Rahmen 
des Allgemeinen Linearen Modells oder Verfahren zur Dimensionsreduzierung 
wie die explorative Faktorenanalyse durchgeführt werden. Eine ausführliche 
Beschreibung aller weiteren, in SPSS möglichen Analysen inklusive der Inter- 
pretation von Ergebnisoutputs findet sich etwa bei Janssen/Laatz (2013) und 
Brosius (2013). 
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Insgesamt wird deutlich, dass eine gemeinsame Analyse quantitativer 
und qualitativer Daten mithilfe computerbasierter Auswertungsprogram- 
me wie SPSS möglich ist. Dies erfordert jedoch eine vorausgehende Quan- 
tifizierung der qualitativen Daten. Das dazu notwendige Vorgehen wurde 
im Rahmen des Kapitels dargestellt. Ist dies erfolgt, können für alle Daten, 
unabhängig davon, ob diese mit qualitativen oder quantitativen Befragungs- 
methoden gewonnen wurden, prinzipiell die gleichen Analyseverfahren an- 
gewandt werden. Dies ermöglicht eine gemeinsame Interpretation der Daten 
und führt zu einer simultanen Verwendbarkeit qualitativer und quantitativer 
Befragungsmethoden. 
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Competences and Motivation in the Bilingual 
History Classroom (COMBIH) - Eine 
Längsschnittstudie zu deutsch-englischem 
Geschichtsunterricht an Gymnasien 


Sara Dallinger‘/ Kathrin Jonkmann 


Die Studie COMBIH untersucht die Entwicklung der Englisch- und Geschichts- 
leistungen sowie der Motivation und Emotionen der Schülerinnen und Schüler 
im bilingualen Geschichtsunterricht. Dabei werden Eingangsunterschiede zwi- 
schen bilingual und regulär einsprachig unterrichteten Lernern zu Beginn des 
bilingualen Geschichtsunterrichts berücksichtigt. Der Schwerpunkt des Beitrags 
liegt auf der Darstellung und Erörterung des triangulativen Gehalts der quanti- 
tativen und längsschnittlichen Studie, bei der zu zwei Messzeitpunkten in Klas- 
senstufe 8 Kompetenztests und Fragebögen für Schülerinnen und Schüler sowie 
Lehrkräfte an Gymnasien in Baden-Württemberg eingesetzt wurden. 


1. Einleitung 


In den letzten Jahren kann in einigen Bundesländern ein Trend zu einer ver- 
stärkten und flächendeckenden Einführung bilingualen Sachfachunterrichts be- 
obachtet werden. Beispielsweise wurde in Baden-Württemberg an 65 Gymnasien 
ein bilingualer Zug eingerichtet und seit 2010 wird deutsch-englischer Sachfach- 
unterricht auch an bis zu 20% aller Realschulen etabliert. In Nordrhein-Westfalen 
wurde das Programm „Bili für alle“ entwickelt (vgl. Breidbach/Viebrock 2012: 
6). Diese politischen Entwicklungen stützen sich teilweise auf wissenschaftliche 
Studien, die zu überwiegend positiven Ergebnissen bezüglich des bilingualen 
Sachfachunterrichts kamen: Bilingual unterrichtete Schülerinnen und Schüler 
scheinen sowohl hinsichtlich ihrer Englisch- als auch ihrer Sachfachkompeten- 
zen von dieser Unterrichtsform zu profitieren (Zydatiß 2007, Lamsfuß-Schenk 
2008, Nold et al. 2008,Witzigmann 2011). Weiterhin zeigen sich sowohl Schul- 
leitungen (Hollm et al. 2013), Lehrkräfte (Kollenrott 2008) als auch Eltern 
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Tübingen, das vom Ministerium für Wissenschaft, Forschung und Kunst Baden- 
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(Dallinger 2013) weitgehend überzeugt vom bilingualen Sachfachunterricht. Im 
Gegensatz zu dieser „Erfolgsgeschichte“ des bilingualen Lehrens und Lernens 
stehen Arbeiten, die diese in Frage stellen. Bruton (2011) verweist auf die in vie- 
len Studien fehlende Analyse der Ausgangslage von bilingual und einsprachig 
unterrichteten Schülerinnen und Schülern, wonach bilingual unterrichtete Ler- 
ner meist schon zu Beginn des bilingualen Unterrichts die leistungsstärkeren und 
motivierteren Schülerinnen und Schüler einer Schule sind. Ihre weiterhin positi- 
ve Entwicklung könnte daher auf diese Eingangsunterschiede statt auf den bilin- 
gualen Unterricht zurückgeführt werden (Zydatiß 2012: 23). Dies führt vor allem 
bei querschnittlichen Studien zu einer systematischen Überschätzung des Effekts 
bilingualen Unterrichts (Rumlich 2014). So argumentiert auch Bonnet: „There 
are strong indications from evaluation research [...] that social selection plays 
an important role in German CLIL. Therefore, high outcomes in CLIL groups 
might well be ascribed to factors other than classroom practice“ (2012: 67). Es 
werden also Längsschnittstudien benötigt, die die unterschiedlichen Lernvor- 
aussetzungen und Ausgangslagen von bilingual und einsprachig unterrichteten 
Schülerinnen und Schülern berücksichtigen und diese bei der Vorhersage von 
Veränderungen entsprechend kontrollieren, um somit den Effekt des bilingualen 
Unterrichts auf Schülerkompetenzen und Motivation bestmöglich isolieren zu 
können (Costa/D’Angelo 2011: 3). Die diesem Beitrag zugrunde liegende Studie 
COMBIH möchte versuchen, diese Forschungslücken zu schließen. 


2. Längsschnittliche Forschung zum bilingualen 
Sachfachunterricht 


Die Unterschiede in den Lernausgangslagen bilingual und einsprachig unter- 
richteter Schülerinnen und Schüler gehen großteils auf die Auswahlprozesse 
zurück, die an Schulen mit fest eingerichtetem bilingualen Profil stattfinden. 
Diese Schulen besitzen neben anderen Spezialisierungen (wie z. B. musisches 
oder naturwissenschaftliches Profil) einen bilingualen Zug, den Schülerinnen 
und Schüler bzw. Eltern am Ende der Grundschule wählen können. Die Aus- 
wahl seitens der Schulverwaltung basiert einerseits auf den Grundschulnoten 
und Empfehlungsschreiben der Grundschullehrkräfte. Anderseits stellen Ge- 
spräche zwischen Schulverwaltung und Eltern einen weiteren zentralen Bau- 
stein des Auswahlverfahrens dar (Zydatiß 2007: 70). Da in diesen Gesprächen 
häufig vermittelt wird, dass bilingualer Unterricht mit höheren kognitiven An- 
sprüchen und Lernaufwand verbunden ist (Hollm et al. 2010: 5, Rumlich 2013a: 
184), darf vermutet werden, dass sich vor allem besonders motivierte und inte- 
ressierte Kinder mit hoher Lernbereitschaft für den bilingualen Zug bewerben. 
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In diesem Sinne kann von einer positiv selektierten Schülerschaft gesprochen 
werden, wenn diese bessere Lernvoraussetzungen aufweist als eine Vergleichs- 
gruppe, wie etwa höhere kognitive Grundfähigkeiten (Helmke/Schrader 2001: 
81), eine höhere Leistungsbereitschaft und Motivation (Wigfield/Eccles 2000) 
und eine größere Bildungsnähe des Elternhauses (Köller et al. 2012: 339). Über 
diese allgemeinen Lernvoraussetzungen hinaus ist es für Studien, die erst im 
Laufe des bilingualen Zuges einsetzen, wichtig, die Unterschiede in den Eng- 
lischleistungen und das Vorwissen im Sachfach zu erfassen und zu kontrollieren, 
um den inkrementellen Effekt des bilingualen Sachfachlernens im Laufe eines 
Schuljahres ermitteln zu können. Im Folgenden wird nun eine Auswahl an Stu- 
dien präsentiert, die aufgrund ihres Längsschnittdesigns diese Ausgangslagen 
der bilingual und einsprachig unterrichteten Schülerschaften berücksichtigen. 

Mit C-Tests verglich Rumlich (2013a) in seiner Studie DENOCS die allge- 
meine Englischkompetenz einer Teilstichprobe von 340 bilingual und 430 nicht 
bilingual unterrichteten Gymnasialschülern. Die nicht bilingual unterrichtete 
Stichprobe setzte sich aus zwei Untergruppen zusammen: Schülerinnen und 
Schüler aus den Parallelklassen der bilingual unterrichteten Klassen sowie Schü- 
lerinnen und Schüler von Schulen ohne bilinguales Unterrichtsangebot. Die Er- 
gebnisse der ersten Testung am Ende der Klasse 6, vor Beginn des bilingualen 
Sachfachunterrichts, verweisen auf deutlich höhere Englischleistungen der zu- 
künftig bilingual unterrichteten Lerner. Bezüglich der beiden Vergleichsgruppen 
schnitten die Schülerinnen und Schüler aus Schulen ohne bilinguales Angebot 
besser ab als die Parallelklassenschüler. Dies deutet darauf hin, dass innerhalb ei- 
ner Schule eher die leistungsstärkeren Schülerinnen und Schüler den bilingualen 
Zug wählen. Weiterhin wurde ein Fragebogen eingesetzt, der unter anderem das 
Schülerinteresse an der Fremdsprache und am Fach Englisch erfasste. Auch hier 
wurde festgestellt, dass bilingual unterrichtete Lerner mehr Interesse zeigten als 
die beiden nicht bilingual unterrichteten Schülergruppen (Rumlich 2014). Die 
Ergebnisse der zweiten Messung zum Ende der Klasse 7 verweisen darauf, dass 
der Leistungsvorsprung der bilingual unterrichteten Schülerinnen und Schüler 
vom ersten Messzeitpunkt bezüglich der allgemeinen Englischkompetenz zwar 
bestehen blieb, sich dieser aber im Verlauf eines Schuljahres nicht weiter vergrö- 
ßerte (Rumlich 2013b). Bilingual und einsprachig unterrichtete Lerner wiesen 
damit weitgehend parallel verlaufende Leistungszuwächse auf; bei den bilingu- 
al unterrichteten Schülerinnen und Schülern erfolgte dies lediglich auf einem 
höheren Niveau. 

Fehling (2008) untersuchte in ihrer Studie die Language Awareness. Zum ers- 
ten Messzeitpunkt, zu Beginn Klasse 7, erhob sie Daten von 74 bilingual und 
65 nicht bilingual unterrichteten Gymnasialschülern. Mithilfe des „Language 
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Awareness-Tests“ und einem Test zur Erfassung der verbalen kognitiven Grund- 
fähigkeiten konnte Fehling zeigen, dass bilingual unterrichtete Schülerinnen 
und Schüler in drei von vier gemessenen Dimensionen der Language Awareness 
(affektiv, kognitiv, politisch) bessere Resultate erzielten. Auch beim kognitiven 
Grundfähigkeitstest schnitten die bilingual unterrichteten Lerner besser ab. Im 
Verlauf der Klassenstufen 7 und 8 zeigten bilingual unterrichtete Schülerin- 
nen und Schüler anschließend größere Zuwächse bezüglich der affektiven und 
kognitiven Dimension als einsprachig unterrichtete Lerner. Das Interesse an 
Englisch blieb bei den bilingual unterrichteten Schülerinnen und Schülern auf 
demselben Niveau wie zu Beginn des bilingualen Unterrichts. Bei den einspra- 
chig unterrichteten Schülerinnen und Schülern nahm das Interesse an Englisch 
jedoch ab. Ein Absinken des Fachinteresses im Laufe der Sekundarstufe ist ein 
vielfach repliziertes entwicklungspsychologisches Phänomen (Wild/Hofer 2000, 
Krapp 2002). Das Entgegenwirken zu diesem Trend kann durchaus als Erfolg 
gewertet werden. 

Zur Entwicklung von Kompetenzen im bilingual unterrichteten Sachfach 
liegen zurzeit kaum Studien vor (Coyle et al. 2010: 136ff., Bonnet 2012: 67). 
Badertscher/Bieri (2009) filmten in sechs Klassen einsprachig sowie bilingual 
unterrichtete Unterrichtseinheiten in den Fächern Geographie und Geschichte 
und führten vor und nach diesen Unterrichtsstunden Interviews mit den Schüle- 
rinnen und Schülern durch, um die Wissensstände zu erfassen. Dieses Vorgehen 
wurde nach 1,5 Jahren in den Klassen wiederholt. Das Forscherteam kam zu 
dem Schluss, dass keine Unterschiede zwischen den Schülergruppen bezüglich 
der Qualität des von den Lernern reproduzierten Sachfachwissens bestanden. 
Zu diesem Ergebnis kamen auch Alonso et al. (2008), die die Fremdsprachen- 
und Sachfachkompetenzen von 229 bilingual und einsprachig unterrichteten 
Sekundarstufenschülern im Baskenland untersuchten. Neben einem größeren 
Leistungszuwachs der bilingual unterrichteten Lerner in Bezug auf den Cam- 
bridge ESOL Test resümierte das Forscherteam, dass diese Schülergruppe ähn- 
liche Leistungen wie die einsprachig unterrichteten Lerner in den Sachfächern 
zeigte. Diese Aussage stützte sich jedoch lediglich auf die subjektive Einschät- 
zung von Lehrkräften sowie auf die Noten der Schülerinnen und Schüler, die 
Referenzgruppeneffekten unterliegen (Baumert et al. 2003). Zusammenfassend 
gilt anzumerken, dass in diesen Studien keine standardisierten und objektiven 
Leistungstests zur Erfassung des Sachfachwissens eingesetzt wurden. 

Auch in Bezug auf die Effekte bilingualen Unterrichts auf die Veränderung 
der Motivation im Sachfach und in der Fremdsprache ist die empirische Daten- 
basis recht klein (Lasagabaster/Sierra 2009: 4). Abendroth-Timmer (2004) un- 
tersuchte bilingual und mehrsprachig unterrichtete Module der Sekundarstufe 
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in verschiedenen Sachfächern für die Arbeitssprachen Englisch, Französisch und 
Spanisch. Mithilfe von Einzelfallanalysen, die auf Schülerinterviews basierten, und 
den Daten von Schülerfragebögen kam sie zu dem Schluss, dass bilingualer Un- 
terricht für die Motivation der Schülerinnen und Schüler nicht abträglich sei, dies 
jedoch von verschiedenen Faktoren abhänge. So kann bilingualer Unterricht bei 
angemessenem Sprach- und inhaltlichem Niveau sowie unter Berücksichtigung 
sachfachdidaktischer Prinzipien seitens der Lehrkraft (z. B. Authentizität, Hand- 
lungsbezug) förderlich auf die Motivation wirken. Zahlreiche querschnittliche Stu- 
dien bestätigen dieses Ergebnis (z. B. Zydatiß 2007, Lamsfuß-Schenk 2008). Diese 
Befunde sollten jedoch mittels standardisierter Fragebögen zur differenzierten Er- 
fassung unterschiedlicher motivationaler Konstrukte wie z. B. Fähigkeitsüberzeu- 
gungen, Fachinteresse, Nutzenbewertung oder Leistungsemotionen im Rahmen 
längsschnittlicher Studien auf eine breitere empirische Basis gestellt werden. 
Abschließend werden zwei Studien querschnittlichen Designs vorgestellt, die 
zwar nicht die Ausgangslagen in Englisch, dafür aber zentrale Indikatoren der 
Lernvoraussetzungen bilingual und einsprachig unterrichteter Schülerinnen und 
Schüler berücksichtigten. Nold et al. (2008) untersuchten mithilfe einer Teilstich- 
probe von DESI die Englischkompetenzen von rund 2000 Gymnasialschülern. 
Hierbei wurden die Daten des zweiten Messzeitpunkts (Ende der 9. Klassenstufe) 
herangezogen. Um dem Problem der positiveren Ausgangslage bilingual unter- 
richteter Lerner zu begegnen, wurden die Schülerinnen und Schüler der Ver- 
gleichsgruppe gezielt ausgewählt. Es wurden 987 Lerner bestimmt, die sich auf 
Basis der Daten des ersten Messzeitpunkts (Beginn der 9. Klassenstufe) nicht von 
den bilingual unterrichteten Schülerinnen und Schülern unterschieden hinsicht- 
lich ihres Geschlechts, der Erstsprache, Schulabschluss und Beruf der Eltern, der 
Note in Deutsch und den kognitiven Grundfähigkeiten. Die Ergebnisse zeigten, 
dass bilingual unterrichtete Schülerinnen und Schüler in vier Kompetenzbe- 
reichen (Hör- und Leseverstehen, Grammatik, Textrekonstruktion) das jeweils 
höhere Kompetenzniveau in Bezug auf den Gemeinsamen Europäischen Refe- 
renzrahmen für Sprachen erreichten als die einsprachig unterrichteten Lerner. 
Die größten Leistungsvorteile traten im Bereich des Hörverstehens auf (DESI- 
Konsortium 2006: 59). Köller et al. (2012) konnten diese Befunde replizieren. 
Sie analysierten die Daten einer Teilstichprobe von 345 bilingual und 9521 ein- 
sprachig unterrichteten Schülerinnen und Schüler der 9. Klassenstufe bezüglich 
ihrer Englischkompetenzen (Hör- und Leseverstehen). Folgende Hintergrund- 
merkmale wurden statistisch kontrolliert, um die Unterschiedlichkeit der beiden 
Schülergruppen zu berücksichtigen: Geschlecht, Erstsprache, Migrationshinter- 
grund, sozioökonomischer Hintergrund, Beruf der Eltern, Deutschkompeten- 
zen der Lerner. Trotz Kontrolle dieser Einflüsse auf die Englischleistungen zeigte 
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sich, dass die bilingual unterrichteten Schülerinnen und Schüler deutlich besser 
in den Tests abschnitten als die regulär einsprachig unterrichteten Lerner. 
Zusammenfassend scheinen bilingual unterrichtete Schülerinnen und Schüler 
eine Schülergruppe zu sein, die über besonders gute Lernvoraussetzungen verfügt. 
Diese Unterschiede müssen Studien, die die Effekte bilingualen Unterrichts be- 
stimmen möchten, kontrollieren. Empirische Befunde weisen beispielsweise da- 
rauf hin, dass der Leistungsvorsprung in Englisch auch dann noch besteht, wenn 
zentrale Hintergrundmerkmale (z. B. kognitive Grundfähigkeiten, Bildungsnähe 
des Elternhauses) kontrolliert werden. Ob diese Unterschiede jedoch auf den er- 
höhten Stundenumfang in Englisch in den Klassenstufen 5 und 6, der von Schüle- 
rinnen und Schülern eines bilingualen Zuges in der Regel geleistet werden muss, 
zurückgehen, lassen die Daten der zitierten Studien offen, da die erste Messung 
zwar immer zu Beginn des bilingualen Sachfachunterrichts, jedoch nicht schon 
zu Beginn des verstärkten Englischunterrichts durchgeführt wurde. Weiterhin 
deuten Rumlichs Ergebnisse an (2013b), dass durch den bilingualen Sachfachun- 
terricht keine inkrementellen Zuwächse erzielt werden, während Fehling (2008) 
für Englisch größere Leistungszuwächse bilingual unterrichteter Lerner feststellt. 
Auch in Bezug auf die Entwicklung von Sachfachkompetenzen sowie von Moti- 
vation und Emotionen liegen bisher nur wenige und zum Teil widersprüchliche 
Ergebnisse vor. Es bedarf an weiterer, belastbarer empirischer Forschung zur Va- 
lidierung und Ausdifferenzierung dieser Befunde, die nicht nur zentrale Aspekte 
wie Kompetenzen und Motivation von Schülerinnen und Schülern im bilingua- 
len Unterricht in den Blick nimmt, sondern auch wichtige Kontextvariablen und 
Hintergrundmerkmale berücksichtigt (Perez-Canado 2012: 330ff.). 


3. Forschungsfragen 


Für die COMBIH-Studie ergibt sich aus den dargestellten Befunden folgender 
Forschungsschwerpunkt: Wie wirkt sich bilingualer Geschichtsunterricht auf 
die Leistungsentwicklung, Motivation und Emotionen der Schülerinnen und 
Schüler in den Fächern Englisch und Geschichte aus? Zur Beantwortung die- 
ser Frage wird ein längsschnittliches Untersuchungsdesign mit einem ersten 
Messzeitpunkt zu Beginn des bilingualen Geschichtsunterrichts in Klassen- 
stufe 8 durchgeführt, um Unterschiede in den Ausgangslagen zwischen den 
Schülerschaften und gegebenenfalls zwischen den Lehrerschaften kontrollie- 
ren und somit potenzielle differentielle Veränderungen im Laufe der Klasse 8 
bestmöglich auf den bilingualen Unterricht zurückführen zu können. Selbst- 
verständlich ist auch bei diesem Untersuchungsdesign die Aussagekraft über 
Ursache-Wirkungs-Zusammenhänge eingeschränkt und davon abhängig, ob die 
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zentralen konfundierenden Variablen gemessen und kontrolliert werden. Echte 
Kausalaussagen sind nur mit einem experimentellen Design und randomisier- 
ter Bedingungszuweisung möglich, bei dem Störvariablen und Alternativerklä- 
rungen ausgeschlossen werden können. Da dies in Bildungssettings meist nicht 
realisierbar ist, muss mit Längsschnittstudien und der Verwendung geeigneter 
statistischer Verfahren eine bestmögliche Approximation geleistet werden. Die 
Forschungsfragen von COMBIH lauten wie folgt: 


Lernvoraussetzungen und Ausgangslagen von bilingual und einsprachig 
unterrichteten Schülerinnen und Schülern zu Beginn der 8. Klassenstufe 


e Inwiefern unterscheiden sich bilingual und einsprachig unterrichtete Schü- 
lerinnen und Schüler zu Beginn des bilingualen Geschichtsunterrichts hin- 
sichtlich ihres familiären Hintergrunds, ihrer kognitiven Grundfähigkeiten, 
ihrer Schulnoten sowie ihrer Leistungen, Motivation und Leistungsemotio- 
nen in den Fächern Englisch und Geschichte? 

e Unterscheiden sich die Englisch- und Geschichtsleistungen von bilingual 
und einsprachig unterrichteten Schülerinnen und Schülern auch dann noch, 
wenn zentrale Hintergrundmerkmale kontrolliert werden? 

e Gibt es Unterschiede zwischen den beiden nicht bilingual unterrichteten Ver- 
gleichsgruppen hinsichtlich der zentralen Konstrukte? 


In Anlehnung an die berichteten Ergebnisse zu den Ausgangslagen der beiden 
Schülergruppen wird erwartet, dass die bilingual unterrichteten Schülerinnen 
und Schüler in den Leistungstests und Schulnoten besser abschneiden als die 
einsprachig unterrichteten Lerner. Außerdem werden für beide Fächer positive- 
re Motivationswerte und Emotionen bei den bilingual Unterrichteten erwartet. 
Darüber hinaus wird angenommen, dass der Leistungsvorsprung der bilingu- 
alen Lerner in Englisch auch dann noch besteht, wenn Hintergrundmerkmale 
kontrolliert werden. Die Leistungsvorsprünge in Geschichte hingegen sollten 
weitgehend durch die Unterschiede in den kognitiven Grundfähigkeiten und 
im familiären Hintergrund erklärt werden. Weiterhin wird angenommen, dass 
die Schülerinnen und Schüler der nicht bilingual unterrichteten Parallelklassen 
niedrigere Leistungen und Motivation aufweisen als die Schülerinnen und Schü- 
ler von Schulen ohne bilinguales Unterrichtsangebot. 


Veränderungen von Kompetenzen, Motivation und Emotionen in der 
8. Klassenstufe in Abhängigkeit vom bilingualen Unterricht 


e Können bilingual unterrichtete Schülerinnen und Schüler einen möglichen 
Leistungsvorsprung gegenüber einsprachig unterrichteten Schülerinnen und 
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Schülern in den Fächern Englisch und Geschichte im Lauf eines Jahres bilin- 
gualen Geschichtsunterrichts weiter ausbauen? 

e Verändern sich die Motivation und die Leistungsemotionen der bilingu- 
al unterrichteten Schülerinnen und Schüler in den Fächern Englisch und 
Geschichte positiver als bei einsprachig unterrichteten Schülerinnen und 
Schülern? 

e Bestehen diese differentiellen Verläufe auch dann noch, wenn die Aus- 
gangslagen, die Hintergrundmerkmale und Kontextvariablen kontrolliert 
werden? 


Bezüglich der Englischkompetenzen wird erwartet, dass die bilingual unterrich- 
teten Schülerinnen und Schüler einen größeren Leistungszuwachs erfahren als 
die einsprachig unterrichteten Lerner, und dass diese Unterschiede auch nach 
Kontrolle der Ausgangslagen, der Hintergrundmerkmale und Kontextvariablen 
statistisch bedeutsam bleiben. Wie sich die Kompetenzen im Fach Geschichte 
entwickeln, ist eine offene Forschungsfrage. Bezüglich der Motivation und Emo- 
tionen bilingual unterrichteter Schülerinnen und Schüler kann erwartet werden, 
dass diese auf demselben (erhöhten) Niveau bleiben wie beim ersten Messzeit- 
punkt, während für die einsprachig unterrichteten Schülerinnen und Schüler 
der typische Entwicklungsverlauf eines sinkenden Interesses vorliegt. 


4. Design der Studie 
4.1 Stichprobe 


Die Stichprobe der Studie bestand aus Schülerinnen und Schülern der 8. Klas- 
senstufe von Gymnasien in Baden-Württemberg. Sie gliederte sich in drei Un- 
tersuchungsgruppen auf. Die erste Gruppe setzt sich aus Schülerinnen und 
Schülern zusammen, die ab Klasse 5 den bilingualen Zug ihrer Schule besuchten. 
In den Klassenstufen 5 und 6 nahmen sie am verstärkten Englischunterricht teil 
(2 zusätzliche Schulstunden pro Woche), und ab Klasse 7 wurden sie in min- 
destens einem Fach pro Schuljahr durchgängig bilingual unterrichtet. In Klasse 
7 war dies Geographie, in der 8. Klasse nahmen die Schülerinnen und Schüler 
zum ersten Mal an bilingualem Geschichtsunterricht teil. Regulär deutschspra- 
chiger Geschichtsunterricht wurde bereits ab Klasse 6 erteilt. Die Schülerinnen 
und Schüler der Vergleichsgruppe I besuchten die Parallelklassen der bilingua- 
len Gruppen, d. h. sie hatten sich gegen den bilingualen Zug entschieden oder 
wurden in diesen nicht aufgenommen. Vergleichsgruppe II umfasste Schüle- 
rinnen und Schüler von Gymnasien ohne bilinguales Unterrichtsangebot. Die 
Lehrerstichprobe setzte sich aus den Geschichtslehrkräften der an der Studie 
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beteiligten Klassen zusammen. Um eine hinreichend hohe statistische Teststärke 
zu gewährleisten, war es das Ziel der Studie, mindestens 20 Klassen pro Gruppe 
zu rekrutieren. Um dies zu erreichen, wurden alle 65 Gymnasien mit bilingua- 
lem Zug in Baden-Württemberg gezielt kontaktiert und um Teilnahme gebeten. 
Die Schulen der Vergleichsgruppe II wurden aus Machbarkeitsgründen aus dem 
näheren Umkreis der Hochschulen gewählt. 28 der Gymnasien mit bilingua- 
lem Zug nahmen an der Studie teil sowie 9 weitere Gymnasien ohne bilingu- 
ales Angebot (vgl. Tab. 1). An der Vorstudie, die der Pilotierung von Teilen der 
Erhebungsmaterialien diente, nahmen 12 Klassen aus vier Gymnasien mit 222 
Schülerinnen und Schülern der Klassenstufen 7 und 8 teil. 


Tab. 1: Stichprobe der Hauptstudie (MZP = Messzeitpunkt) 


rn Klassen Schüler Schüler 
MZP1 MZP2 
mit bilingualem Zug 28 | Bilingual-Klassen 30 664 661 
VergleichsgruppeI 28 588 577 
en 9 | Vergleichsgruppe II 17 411 394 
Gesamt 37 75 1663 1632 


4.2 Organisation und Ablauf der Studie 


Vor Beginn der Datenerhebungen wurden alle eingesetzten Materialien und Pro- 
zeduren für eine datenschutzrechtliche Prüfung an das Ministerium für Kultus, 
Jugend und Sport Baden-Württemberg geleitet. Diese wurden dort begutachtet 
und für die Untersuchung freigegeben. Der erste Messzeitpunkt fand im Septem- 
ber und Oktober 2012 statt. Dieser Zeitpunkt wurde gewählt, um die Schülerin- 
nen und Schüler und Lehrkräfte zu Beginn des Schuljahres befragen zu können. 
Dieselbe Schüler- und Lehrerstichprobe wurde im Juni und Juli 2013, zum Ende 
des Schuljahres, ein zweites Mal befragt. Zum ersten Messzeitpunkt nahm die Da- 
tenerhebung insgesamt 135 Minuten in Anspruch (exklusive der Pausenzeiten), 
zur zweiten Messung 115 Minuten. Die Erhebungen wurden mithilfe eines stan- 
dardisierten Manuals von geschulten Testleitern durchgeführt. Zusätzlich waren 
Lehrkräfte im Klassenzimmer anwesend. Das Test- und Befragungsmaterial der 
Schülerinnen und Schüler wurde vor Ort ausgeteilt und nach Beendigung der Er- 
hebung wieder von den Testleitern eingesammelt. Die Lehrerfragebögen, die ca. 
20 Minuten in Anspruch nahmen, wurden entweder an der Schule oder zuhause 
ausgefüllt. 
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4.3 Erhebungsinstrumente 


Die Untersuchungsmaterialien der Schülerinnen und Schüler umfassten Leis- 
tungstests und einen Fragebogen. Die Englischleistungen wurden mittels eines 
eigens entwickelten C-Tests sowie mit einem Hörverstehenstest aus dem Aufga- 
benpool der Bildungsstandards (IQB) geprüft. Das Geschichtswissen der Schü- 
lerinnen und Schüler aus den Klassen 7 und 8 wurde mithilfe von Lückentexten 
und Multiple Choice-Aufgaben gemessen, die in Kooperation mit Geschichts- 
didaktikern entwickelt wurden. Außerdem wurden Fragen zur Erfassung der 
historischen De- und Rekonstruktionskompetenz (Bertram 2012) in Anlehnung 
an das Kompetenz-Strukturmodell für historisches Denken nach Schreiber et al. 
(2006) integriert. Die figuralen und verbalen kognitiven Grundfähigkeiten der 
Schülerinnen und Schüler wurden mit Subtests des Kognitiven Fähigkeitstests 
erhoben (KFT, Heller/Perleth 2000). Die Fragebogenitems zur Schülermotiva- 
tion in den Fächern Englisch und Geschichte orientierten sich an dem Erwar- 
tungs-Mal-Wert-Modell nach Wigfield/Eccles (2000), das sich bereits in vielen 
pädagogisch-psychologischen Studien bewährt hat. In diesem Modell werden 
unterschiedliche motivationale Konstrukte zur Erklärung leistungsbezogenen 
Verhaltens berücksichtigt, wie beispielsweise Interesse, subjektiver Nutzen und 
akademisches Selbstkonzept. Die Erfassung fachspezifischer Leistungsemotio- 
nen (z.B. Freude, Langeweile) erfolgte auf Basis der Kontroll-Wert-Theorie nach 
Pekrun (2006,vgl. auch Götz et al. 2010, Götz/Frenzel 2010). Im Schülerfragebo- 
gen befanden sich weiterhin Fragen zum bilingualen Geschichtsunterricht (z. B. 
Bewertung der Unterrichtsform, Rolle des Englischen) sowie allgemeine Fragen 
zur Unterrichtsqualität in den Fächern Englisch und Geschichte (COACTIV- 
Studie; Kunter et al. 2011). Die Operationalisierung des familiären Hintergrunds 
orientierte sich an den PISA-Studien. Außerdem wurden die Schulnoten der 
Lerner erhoben. Die Geschichtslehrkräfte der betreffenden Klassen erhielten 
einen Fragebogen mit eigens entwickelten Fragen zu methodisch-didaktischen 
Aspekten des (bilingualen) Geschichtsunterrichts, ihrer Lehrerbiographie sowie 
zu arbeitsbezogenen Verhaltens- und Erlebensmustern (AVEM; Schaarschmidt/ 
Fischer 2008). 


4.4 Datenanalyse 


Die Studie wird derzeit unter Verwendung der Softwarepakete SPSS und Mplus 
insbesondere mit regressionsanalytischen Verfahren ausgewertet. Da ganze 
Klassen in die Untersuchung aufgenommen wurden, liegen keine vollständig un- 
abhängigen Beobachtungen vor. Diese geschachtelte Datenstruktur wird bei den 
Analysen berücksichtigt. Andernfalls würden die Standardfehler unterschätzt 
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und es erfolgt eine zu liberale statistische Signifikanzprüfung (Raudenbush/ 
Bryk 2002). Darüber hinaus sollen Mehrebenenregressionsmodelle spezifiziert 
werden (Snijders/Bosker 2011), um die Bedingungsfaktoren eines effektiven bi- 
lingualen Geschichtsunterrichts auf Klassenebene identifizieren zu können. 


5. Aspekte der Triangulation 
5.1 Theoretische Vorüberlegungen 


Der Begriff der Triangulation wurde in den letzten Jahren verstärkt in der em- 
pirischen Forschung sowie im Rahmen definitionstheoretischer Reflexionen 
verwandt (Riemer 2011, Gläser-Zikuda et al. 2012). Während Einigkeit darü- 
ber herrscht, dass Triangulation die Kombination verschiedener Zugänge zum 
Forschungsgegenstand meint, besteht Unbestimmtheit darüber, was genau in 
welchem Maße kombiniert wird.” Auch der Begriff Triangulation ist nicht völ- 
lig eindeutig, sondern wird von verschiedenen Autoren in variierenden Bedeu- 
tungszusammenhängen und mitunter synonym mit dem „integrativen Ansatz“ 
nach Seipel/Rieker (2003) oder dem mixed methods approach nach Jick (1979) 
verwendet. Im Folgenden werden nun zwei theoretische Modelle der Triangula- 
tion vorgestellt, um diese dann in einem zweiten Schritt auf die COMBIH-Studie 
anzuwenden. 

Ein Triangulationsmodell stammt von Ivankova/Creswell (2009). Ihr 
mixed-methods Ansatz schreibt nur solchen Forschungsprojekten triangu- 
lativen Charakter zu, die qualitativ und quantitativ gewonnene Datensätze 
miteinander kombinieren. Das explanatory und das exploratory design legen 
den Fokus auf nur eine Forschungsmethode (quantitativ oder qualitativ) und 
betrachten die jeweils andere lediglich als der Hauptstudie zuarbeitende Da- 
tenerhebungsmethode. Im triangulation design hingegen findet die qualitati- 
ve und quantitative Datensammlung und -auswertung gleichberechtigt statt. 
In der Phase der Dateninterpretation werden die beiden Ansätze kombinativ 
zusammengeführt. 

Das zweite Modell findet sich in Flick (2011), der an Denzins Unterteilung in 
vier Formen der Triangulation von 1970 anknüpft. Als triangulativ wird dem- 
nach angesehen, 


e wenn mehrere Forscherinnen und Forscher eingesetzt werden, um Daten zu 
erheben (Forscher-Triangulation), 


2 Eine ausführliche Diskussion hierzu findet sich in Flick (2011). 
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e wenn verschiedene Datensätze kombiniert werden, die an verschiedenen 
Orten, zu verschiedenen Zeitpunkten und an verschiedenen Personen(-grup- 
pen) gewonnen wurden (Daten-Triangulation), 

e wenn sich Forscherinnen und Forscher mit mehreren, forschungsparadigma- 
tisch divergierenden Perspektiven und Hypothesen einem Untersuchungsge- 
genstand nähern (Theorien-Triangulation) 

e und wenn verschiedene methodische Zugänge miteinander kombiniert 
werden (Methoden-Triangulation), was sowohl innerhalb von als auch 
zwischen Forschungsparadigmen erfolgen kann (within-method bzw. 
between-method). 


Die Kombination verschiedener Forschungszugänge verfolgt in der Regel zwei 
Absichten (Flick 2011: 9). Sie dient entweder der Validierung von Daten bzw. 
Erhebungsinstrumenten (hiermit soll Konvergenz erzielt werden) oder sie dient 
der Erkenntniserweiterung (dies führt entweder zu komplementären oder zu di- 
vergierenden Ergebnissen). Während erstere Funktion vor allem zu Beginn der 
Triangulationsforschung als Hauptziel gesehen wurde, fand mittlerweile ein Pa- 
radigmenwechsel statt, der nun die erweiterten Erkenntnismöglichkeiten in den 
Mittelpunkt rückt. Die vorliegende Studie folgt dem Konzept der Triangulation 
nach Flick, da sich Triangulation als umbrella term verstehen lässt, innerhalb 
dessen sich Ivankovas/Creswells Ansatz zwar im Sinne der between-method ver- 
orten lässt, der darüber hinaus jedoch vielfältige Formen der Triangulation in 
Bezug auf Forscher, Datensätze und Theorien bietet. 


5.2 Triangulation in der COMBIH-Studie 
5.2.1 Forscher-Triangulation 


Um den bisherigen Forschungsstand zum bilingualen Sachfachunterricht sys- 
tematisch zu erweitern, wurde die Expertise verschiedener Fachdisziplinen 
vereinigt. So wurden insbesondere die grundlegenden englisch- und geschichts- 
didaktischen Fragestellungen der Studie sowie die Entwicklung der Leis- 
tungstests in den Sachfächern von den Fachdidaktikabteilungen Englisch und 
Geschichte der Pädagogischen Hochschule Ludwigsburg betreut. Für die zentra- 
len psychologischen Konstrukte in den Fragebögen bedurfte es der Expertise der 
Pädagogischen Psychologie. Dies, sowie die Entwicklung des Studiendesigns, die 
Betreuung der psychometrischen Verfahren und statistisch-analytische Unter- 
stützung wurde von der Abteilung Empirische Bildungsforschung und Päda- 
gogische Psychologie der Universität Tübingen geleistet. Diese interdisziplinäre 
Zusammenarbeit im Rahmen des Kooperativen Promotionskollegs „Effektive 
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Lehr-Lernarrangements“ führte zur Integration verschiedenster Perspektiven 
und Forschungstraditionen und somit zu einer möglichst angemessenen Annä- 


herung an den Forschungsgegenstand. 


Abb. 1: Daten-Triangulation in der COMBIH-Studie. 
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5.2.2 Daten-Triangulation 


Auch der Ansatz der Daten-Triangulation wurde in die COMBIH-Studie inte- 
griert. Dieser verfolgte zwei Absichten (vgl. Abb. 1). Erstens diente die Vorstu- 
die der Validierung des neu entwickelten Test- und Befragungsmaterials. Nach 
der Auswertung der Pilotierungsdaten wurden die Aufgaben des Geschichtstests 
verbessert sowie eine Selektion der psychometrisch besten, den Gütekriterien 
empirischer Forschung entsprechenden Items zum bilingualen Unterricht vor- 
genommen. Diese so optimierten Instrumente wurden dann in die Sammlung 


3  Arbeitsbezogene Verhaltens- und Erlebensmuster (vgl. Abschnitt 4.3). 
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der übrigen (bereits in anderen Studien validierten) Instrumente für die Haupt- 
studie aufgenommen. Zweitens diente der Ansatz der Daten-Triangulation 
dazu, verschiedene Perspektiven miteinander zu kombinieren und somit eine 
Erkenntniserweiterung herbeizuführen. Dies wurde in COMBIH durch die fol- 
genden Maßnahmen erreicht. 


Längsschnittliches Design 

Schüler- und Lehrerdaten wurden zu zwei Messzeitpunkten erhoben. Der erste 
Messzeitpunkt dient der Erfassung der Ausgangslage der beiden Schülergrup- 
pen zu Beginn des bilingualen Unterrichts, die zweite Messung erlaubt Aussagen 
über mögliche Veränderungen. Mit dem Geschichtstest wird beispielsweise zu- 
nächst das Vorwissen der Schülerinnen und Schüler zu den Inhalten der Klas- 
se 8 überprüft, um dann mithilfe der Messung am Ende des Schuljahres den 
Leistungszuwachs erfassen zu können. Dasselbe trifft auf die Entwicklung der 
Englischkompetenzen und der Schülermotivation und Emotionen bezüglich der 
Fächer Englisch und Geschichte zu. Würden die Schülerinnen und Schüler nur 
am Ende des Schuljahres, also nach erfolgtem bilingualen Geschichtsunterricht, 
befragt und getestet, wüsste man zwar, wie die Lerner diese Unterrichtsform er- 
lebt und welche Leistungen sie in Geschichte und Englisch erbracht haben. Es 
wären jedoch keine Informationen darüber vorhanden, ob diese Unterschiede 
nicht bereits vor Beginn des bilingualen Geschichtsunterrichts bestanden. Zwei 
Messzeitpunkte hingegen gestatten es - sofern die entscheidenden konfundie- 
renden Variablen kontrolliert werden - Aussagen über die Effekte des bilingua- 
len Geschichtsunterrichts zu treffen: Wie verändern sich Leistungen, Motivation 
und Emotionen von bilingual unterrichteten Lernern durch den bilingualen 
Geschichtsunterricht? 


Leistungstests und Fragebogen 

Die Schülerinnen und Schüler bearbeiteten zu beiden Messzeitpunkten Leis- 
tungstests und einen Fragebogen. Bezüglich der Englischleistungen wurde ein 
C-Test zur Erfassung der allgemeinen Englischkompetenz eingesetzt sowie ein 
Hörverstehenstest, da bezüglich dieses Kompetenzbereichs besonders große Un- 
terschiede zwischen bilingual und einsprachig unterrichteten Schülerinnen und 
Schülern erwartet werden. Das Geschichtswissen wurde mithilfe eines Lücken- 
texts und Multiple Choice-Aufgaben erhoben. Der Geschichtstest zu Inhalten aus 
Klasse 7 soll zeigen, wie gut die Lerner bisher in Geschichte waren. Der Test zu 
Inhalten aus Klasse 8 dient zum ersten Messzeitpunkt als Vorwissenstest und zu 
Messzeitpunkt zwei als Maß für den Zuwachs an Geschichtswissen. Um über 
das Sachwissen hinaus auch Kompetenzen im Fach Geschichte berücksichtigen 
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zu können, wurden Fragen zur historischen De- und Rekonstruktionskompe- 
tenz integriert. Zusätzlich wurden als Indikatoren der Lernvoraussetzungen 
zwei kognitive Grundfähigkeitstests eingesetzt. Die Tests sind von besonderer 
Bedeutung, da fundierte, objektive Aussagen zu Schülerleistungen getroffen 
werden können, die mithilfe der Erhebung von Schulnoten und dem akademi- 
schen Selbstkonzept nicht möglich wären. Mit dem Schülerfragebogen wurden 
mehrere Aspekte erfasst: zum einen die zentralen Konstrukte Motivation und 
Emotionen in den Fächern Englisch und Geschichte. Zum anderen wurden 
Fragen integriert, die die Schüler dazu aufforderten, ihren Englisch- und Ge- 
schichtsunterricht sowie die Lehrkräfte einzuschätzen. So kann ein Bild davon 
gewonnen werden, wie Unterricht in den verschiedenen Klassen der Stichprobe 
ablief. Außerdem dienen diese Fragen der Kontrolle von Schülerleistung, Mo- 
tivation und Emotionen. Mithilfe des umfangreichen Test- und Befragungsma- 
terials sollte der Forschungsgegenstand so umfassend und präzise wie möglich 
erfasst werden. 


Schüler- und Lehrerperspektive 

In der Studie wurden sowohl Schüler- als auch Lehrerdaten erhoben. Im Lehrer- 
fragebogen befanden sich Fragen zu methodisch-didaktischen Aspekten des 
(bilingualen) Geschichtsunterrichts, Fragen zur Person, zur Lehrerbiographie, 
zu arbeitsbezogenen Verhaltens- und Erlebensmustern und eine Einschätzung 
der an der Studie teilnehmenden Klasse. Mithilfe dieser rund 160 Items soll- 
te der Geschichtsunterricht der Schülerinnen und Schüler so ausgewogen und 
differenziert wie möglich erfasst werden. Weiterhin diente die Befragung der 
Lehrkräfte der Kontrolle von Kontextvariablen. Denn Lehrkräfte und die da- 
mit in Verbindung stehende Qualität des Unterrichts nehmen Einfluss sowohl 
auf motivationale und emotionale Aspekte als auch auf das Kompetenzerle- 
ben und die Leistungsentwicklung der Schülerinnen und Schüler (Helmke/ 
Schrader 2001, Kunter et al. 2011). So können Aussagen über Motivation, Emo- 
tionen und Schülerkompetenzen getroffen werden, die unabhängig sind von mit 
der Lehrkraft in Verbindung stehenden Faktoren. Denn sollten diese Faktoren 
systematisch zwischen bilingual und einsprachig unterrichtenden Lehrkräften 
variieren, wäre dies eine weitere Varianzquelle, die es bei der Isolation der Effek- 
te des bilingualen Unterrichts zu kontrollieren gilt. 


4 Einschränkend muss eingeräumt werden, dass lediglich die Wahrnehmung der Schü- 
ler (und Lehrkräfte) berichtet werden kann und unklar bleibt, inwieweit diese mit 
den tatsächlichen unterrichtlichen Vorgängen übereinstimmen. 
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Bilingual unterrichtete Klassen und zwei Vergleichsgruppen 

Um die Effekte des bilingualen Geschichtsunterrichts auf die Entwicklung von 
Englisch- und Geschichtskompetenzen, Schülermotivation und Emotionen zu 
bestimmen, bedarf es mindestens einer Vergleichsgruppe deutschsprachig un- 
terrichteter Schülerinnen und Schüler. Würden Ergebnisse auf eine deutlich po- 
sitivere Entwicklung von Kompetenzen, Motivation und Emotionen bilingual 
unterrichteter Schülerinnen und Schüler in den Fächern Englisch und Geschich- 
te verweisen, könnte dies das Konzept des bilingualen Lehrens und Lernens 
weiter stärken und die Ausweitung des bilingualen Unterrichtsangebots unter- 
stützen. Durch die Einbindung von zwei Vergleichsgruppen - Parallelklassen 
und Klassen aus Schulen ohne bilinguales Angebot - wird bezweckt, mögliche 
Unterschiede innerhalb der nicht bilingual unterrichteten Schülerschaft zu un- 
tersuchen. Diese könnten zu Ungunsten der Parallelklassenschüler ausfallen und 
eine Konsequenz der positiven Selektion der bilingual unterrichteten Lerner an 
den bilingualen Zugschulen darstellen. 


Gymnasien aus ganz Baden-Württemberg 

Die an der Studie beteiligten Gymnasien sind über ganz Baden-Württemberg 
verteilt und tragen somit zum Ansatz der Daten-Triangulation bei, wonach ver- 
schiedene Datensätze an unterschiedlichen Orten gewonnen werden. Die Daten- 
erhebung fand sowohl an Gymnasien statt, die an der hessischen Grenze liegen, 
als auch an Schulen am Bodensee und in Freiburg; an Gymnasien, die in der 
Nähe Frankreichs und in der Nähe Bayerns liegen. Darüber hinaus waren an der 
Studie sowohl städtische als auch ländliche Gymnasien beteiligt, durchschnitt- 
lich große Schulen mit rund 1000 Schülerinnen und Schülern und größere, 
bis zu elfzügige Schulen. Diese unterschiedlichen und recht gleichmäßig über 
Baden-Württemberg verstreut gelegenen Gymnasien decken ein weites Spek- 
trum der Zielpopulation ab. Allerdings stellen die Schulen keine repräsentativ 
und zufällig gezogene Stichprobe dar (vgl. Abschnitt 4.1), weshalb die gewonnen 
Daten nur begrenzt auf die Grundgesamtheit übertragen und verallgemeinert 
werden können. 


5.2.3 Zusammenführung der triangulativen Aspekte 

Bei der Analyse der Daten und Interpretation der gewonnenen Ergebnisse von 
COMBIH werden alle obig berichteten triangulativen Aspekte gleichermaßen 
berücksichtigt: die unterschiedlichen disziplinären Perspektiven, die beiden 
Messzeitpunkte, zu denen eine sehr große Stichprobe verteilt über das ganze 
Bundesland untersucht wurde, die objektiven Leistungstests sowie die standar- 
disiert erfassten Selbstberichte zum Unterrichtserleben, zur Motivation und zu 
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Emotionen, die Schüler- und Lehrerperspektive sowie die unterschiedlichen 
Vergleichsgruppen. In diesem Sinne kann in Anlehnung an die Arbeiten von 
Ivankova/Creswell die Gewichtung der verschiedenen Datenquellen bei COM- 
BIH - „the relative importance or priority given to each type of data“ (2009: 
138) - als gleichgewichtet bezeichnet werden. Somit wird einer wichtigen Forde- 
rung dieses forschungsparadigmatischen Ansatzes Rechnung getragen, wonach 
der Mehrwert der Triangulation in der bedeutsamen Integration und nicht in 
einer bloßen Akkumulation von verschiedenen Zugängen zum Forschungsge- 
genstand liegt. 
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Triangulation: Möglichkeiten, 
Grenzen, Desiderate 


Karin Aguado 


Die Triangulation erfreut sich in jüngster Zeit insbesondere beim wissenschaft- 
lichen Nachwuchs einer stetig wachsenden Popularität, was angesichts der 
Komplexität der Erforschung von fremdsprachenbezogenen Lehr- und Lern- 
prozessen grundsätzlich zu begrüßen ist. Da diese Forschungsstrategie jedoch 
mit einer erheblichen Mehrarbeit verbunden ist, gilt zunächst grundsätzlich ab- 
zuwägen, ob ihre Anwendung der eigenen Fragestellung tatsächlich angemes- 
sen ist. Im vorliegenden Beitrag werden zunächst ausgewählte theoretische und 
praktische Aspekte der Triangulation skizziert. Da in der qualitativen Forschung 
ja der Gegenstand bzw. das Erkenntnisinteresse eine entscheidende Rolle bei 
der Bestimmung der für die empirische Untersuchung einzusetzenden metho- 
dischen Verfahren spielt, wird im Anschluss die ‚Angemessenheit‘ als zentrales 
Gütekriterium empirischer Forschung diskutiert. Diese Überlegungen sollen bei 
der Entscheidung für oder gegen die Anwendung der Triangulationsstrategie 
helfen. Abschließend werden einige offene Fragen und Desiderate formuliert, 
deren weitere Diskussion meiner Ansicht nach lohnt. 


1. Einleitung 


Triangulation hat sich - zumindest in primär qualitativ-interpretativ angeleg- 
ten empirischen Studien - inzwischen zu einer weit verbreiteten Forschungs- 
strategie entwickelt und zwar nicht zuletzt, weil das Verstehen von komplexen 
Zusammenhängen im Sinne eines methodisch kontrollierten Fremdverstehens 
ein zentrales Erkenntnisprinzip qualitativer Forschung darstellt (vgl. dazu Ar- 
beitsgruppe Bielefelder Soziologen 1976). Grundvoraussetzung für die Akzep- 
tanz der Triangulation sowohl auf Seiten derjenigen, die sie anwenden, als auch 
auf Seiten derjenigen, welche die mit ihrer Hilfe erzielten Ergebnisse rezipieren, 
ist eine methodologische Offenheit, in der Ausschließlichkeits- oder Prioritä- 
tenansprüche einer Methodologie respektive einer Methode gegenüber einer 
anderen keine Rolle spielen (vgl. dazu auch Lamnek 2005: 279). Insbesondere 
in Forschungen, die faktorenkomplexe Gegenstände wie z.B. das Lehren und 
Lernen von Sprachen untersuchen, scheinen mehrmethodische Vorgehenswei- 
sen angemessen zu sein, weil sie eine höhere Adäquanz ermöglichen und somit 
auch für alltagsweltliche Akteure verstehbar und vernünftig erscheinen (vgl. 
Schütz 1974). Ob und inwieweit die mit triangulativen Verfahren verbundenen 
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Erwartungen berechtigt und erfüllbar sind, wird im vorliegenden Sammelband 
anhand ausgewählter empirischer Studien diskutiert. 

Es besteht das Problem, dass die Triangulation von nicht wenigen Kollegen 
und Kolleginnen inzwischen nicht nur als Merkmal, sondern sogar als Gütekri- 
terium qualitativer Forschung betrachtet wird (vgl. z.B. Mayring 2002: 147). Ich 
halte dies u.a. deshalb für problematisch, weil dadurch insbesondere wenig er- 
fahrene Forscherinnen und Forscher! den Eindruck gewinnen (müssen), dass 
ein mehrmethodisches Vorgehen für eine hochwertige, aktuellen forschungs- 
methodologischen Entwicklungen verpflichtete qualitative Forschung zwingend 
erforderlich sei - schließlich will man ja als qualitativ arbeitende Forscherin bzw. 
als qualitativ arbeitender Forscher die gültigen Gütekriterien einhalten und gute 
Forschung machen. Es soll jedoch im Folgenden gezeigt werden, dass Triangula- 
tion weder ein Wert an sich noch ein Gütekriterium qualitativer Forschung ist! 

Da die wesentlichen Formen, Merkmale und Funktionen der Triangulations- 
strategie bereits in der Einleitung der beiden Herausgeberinnen Daniela Elsner 
und Britta Viebrock als auch in dem Beitrag von Julia Settinieri (Kap. 2 in die- 
sem Band) ausführlich dargestellt worden sind, möchte ich sie im Folgenden nur 
kurz skizzieren (vgl. auch Aguado/Riemer 2001 oder Aguado 2009). Stattdessen 
soll die Aufmerksamkeit in erster Linie auf terminologische und konzeptionelle 
sowie auf praktische Überlegungen hinsichtlich der Möglichkeiten und Grenzen 
gerichtet werden, die in der einschlägigen Literatur im Zusammenhang mit der 
Triangulationsstrategie diskutiert werden. 

In Bezug auf die Terminologie stellt sich zunächst einmal die Frage nach der 
Angemessenheit der Übertragung des Ausdrucks „Triangulation aus der Geo- 
däsie auf die Forschungsmethodologie der Sozialwissenschaft, der Erziehungs- 
wissenschaft oder der Fremdsprachendidaktik - also allesamt Disziplinen, die 
vollkommen andere Gegenstände, Erkenntnisinteressen und Fragestellungen 
haben als die in erster Linie an exakten Messungen interessierten Naturwissen- 
schaften. Hinzu kommt das Problem, dass die verschiedenen Termini ‚Irian- 
gulation, mixed methods, Mehr-Methoden-Design oder ‚Methodenintegration‘ 
- auch von einschlägigen Kolleginnen und Kollegen wie z.B. Denzin/Lincoln 
(1994) - vielfach synonym gebraucht werden, was jedoch ungenau ist und da- 
her vermieden werden sollte, und zwar nicht zuletzt weil z.B. Studierende oder 
Nachwuchswissenschaftler/innen, welche die historische Entwicklung der hier 


1 In den Beiträgen dieses Bandes werden maskuline und feminine Formen in 
unterschiedlicher Weise verwendet. Unter der Voraussetzung, dass jeweils beide 
Geschlechter gemeint sind, haben die Herausgeberinnen entschieden, diese Vielfalt 
bestehen zu lassen. 
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relevanten Konzepte, Konstrukte und Strategien nicht kennen, eine verkürzte 
und damit z.T. unzutreffende Vorstellung davon erhalten. 

Der Zusammenhang zwischen Gegenstand und Methode ist komplex und 
vielfältig und kann hier nicht im Detail diskutiert werden. Zentral für den vor- 
liegenden Kontext ist die Tatsache, dass in der qualitativen Forschung der Ge- 
genstand und nicht die Methode im Zentrum steht. In einem nächsten Schritt 
soll daher das Kriterium der Angemessenheit diskutiert werden, das in der qua- 
litativen Forschung grundsätzlich für die Auswahl jeder Methode der Erhebung, 
Aufbereitung und Auswertung von Daten zu beachten ist und das daher selbst- 
verständlich auch für die Auswahl und Kombination mehrerer Methoden inner- 
halb einer Studie gilt. 

Abschließend sollen noch einmal der in der Diskussion bisher erreichte Mi- 
nimalkonsens hinsichtlich der Triangulationsstrategie und Möglichkeiten sowie 
Erfordernisse ihrer Weiterentwicklung angesprochen werden (für eine aktuelle 
Darstellung siehe Kuckartz 2014). In diesem Zusammenhang werden auch eini- 
ge der im forschungsmethodologischen Diskurs bereits mehrfach formulierten 
Desiderate aufgegriffen. 


2. Terminologisches, Konzeptionelles, Praktisches 


Zu dem Terminus „Triangulation, der sich inzwischen etabliert hat (was auch 
an dem Titel des vorliegenden Sammelbands und der ihr zugrunde liegenden 
DGFF-Sommerschule erkennbar ist), ist zu sagen, dass die Übertragung aus 
einer Naturwissenschaft auf die Sozialwissenschaften sowie auf andere, vorwie- 
gend qualitativ arbeitende Disziplinen streng genommen unangemessen ist (vgl. 
dazu auch Blaikie 1991). Der Grund ist, dass es bei der Erdvermessung um eine 
formal berechenbare, durch die Einnahme mehrerer Perspektiven möglichst 
genaue Positionsbestimmung geht, während in sozial- oder lehr-/lernwissen- 
schaftlichen Forschungen auf eine inhaltlich beschreibende, verstehende und/ 
oder interpretative Untersuchung des jeweiligen Gegenstands abgezielt wird. 
D.h. ursprünglich, also in den Naturwissenschaften und in anderen bevorzugt 
analytisch-nomologisch arbeitenden Disziplinen, bestand die Hauptfunktion 
der Triangulationsstrategie in der Vermeidung von Verzerrungen bzw. Messfeh- 
lern und somit im Ausschluss von Messartefakten (vgl. Campbell/Fiske 1959). 
Daraus resultiert auch die eher defizitbasierte Annahme, dass durch die Anwen- 
dung mehrerer Methoden die jeder Einzelmethode inhärenten Schwächen kom- 
pensiert werden könnten - eine Sichtweise auf Methoden, die der qualitativen 
Forschung eher fremd ist oder sein sollte, wählt man eine Methode doch wegen 
ihrer Eignung und ihrer Vorzüge aus und nicht damit sie Unzulänglichkeiten 
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ausgleicht. Bereits an dieser Stelle werden grundlegende Unterschiede zwischen 
quantitativen und qualitativen Sichtweisen auf die möglichen Funktionen der 
Triangulation - also Validierung vs. Erkenntniserweiterung - deutlich. Fielding 
und Fielding (1986) zweifelten bereits Mitte der 1980er Jahre daran, dass man 
die mit einer Methode gewonnenen Daten durch die mit einer anderen Me- 
thode gewonnenen Daten korrigieren könnte. Wenn man sich überhaupt auf 
eine solche kompensatorische Argumentation einlassen will, erscheint es eher 
angemessen anzunehmen, dass eine mehrmethodische Herangehensweise der 
Kompensation von blinden Flecken, aber nicht der von Schwächen dienen kann. 
Dass ein Gegenstand durch die zu seiner Untersuchung eingesetzten Methoden 
konstituiert wird, gehört in der forschungsmethodologischen Diskussion in- 
zwischen zum Konsens: Jede Methode ermöglicht die Betrachtung eines spe- 
zifischen Ausschnitts, einer bestimmten Perspektive, einer anderen Facette des 
jeweiligen Gegenstands und bestimmt somit, was wir über ihn erfahren. Insbe- 
sondere auch deshalb erscheint die Kombination mehrerer Methoden sinnvoll. 
Die Anerkennung dieser Tatsache bringt eine Reihe von Konsequenzen für die 
empirische Forschung mit sich, die meiner Ansicht nach bisher noch nicht aus- 
reichend diskutiert worden sind. So ergibt sich für die Methoden-Kombination 
innerhalb einer Studie die grundsätzliche Frage, ob es überhaupt möglich ist, 
mittels verschiedener Methoden genau denselben Gegenstand zu untersuchen. 
Müsste es - unter der zuvor genannten Prämisse, dass ja die Methode den Ge- 
genstand konstituiert - nicht vielmehr so sein, dass verschiedene Methoden 
zwingend verschiedene Gegenstände untersuchen? Hier könnte man entgegnen, 
dass es natürlich auf den Gegenstand ankommt, d.h. es gibt einfache und kom- 
plexe Gegenstände, und wie ein Gegenstand definiert wird, was dazu gehört bzw. 
aus welchen Komponenten er sich zusammensetzt, entscheidet letztlich der/die 
Forschende selbst bzw. die scientific community, der er/sie angehört. Der Gegen- 
stand ‚Lehren und Lernen von Fremdsprachen‘ ist beispielsweise außerordent- 
lich komplex (vgl. zur Faktorenkomplexion in der Fremdsprachenforschung 
Grotjahn 2006: 248), und um dieser Komplexität angemessen Rechnung zu tra- 
gen, bedarf es differenzierter forschungsmethodologischer Überlegungen und 
Entscheidungen sowie methodisch geeigneter Instrumente und Verfahren, die 
in der Regel individuell und spezifisch für den zu untersuchenden Gegenstand 
entwickelt werden, was jedoch nicht unerhebliche Probleme hinsichtlich der Re- 
plikation mit sich bringt (vgl. auch Abschnitt 3). 

Der Hintergrund der Frage, ob mittels verschiedener Methoden exakt dersel- 
be Gegenstand oder verschiedene Facetten eines Gegenstands erfasst werden, 
ist der, dass von ihrer Beantwortung abhängt, welche Funktion der Mehrmetho- 
deneinsatz hat: Geht es um die kumulative Validierung oder um die umfassende 
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Erfassung, Beschreibung und Erklärung (vgl. zur Begrifflichkeit Kelle/Erzberger 
2000)? 

Ziel der qualitativen Forschung sind sogenannte ‚dichte‘ Beschreibungen (Ge- 
ertz 1983), die einen Gegenstand nicht nur in der Tiefe und in ihrem Kern erfas- 
sen, sondern die darüber hinaus ihren Rezipientinnen und Rezipienten - sowohl 
Kolleg/innen als auch Anwender/innen - eine Einschätzung hinsichtlich der 
Glaubwürdigkeit und der Übertragbarkeit der gewonnenen Erkenntnisse ermög- 
lichen sollen. In diesem Zusammenhang ist offenkundig, dass die Einnahme le- 
diglich einer Perspektive zwar eine sehr detaillierte Betrachtung ermöglicht, aber 
im Hinblick auf den Gesamtzusammenhang nur beschränkt Rückschlüsse erlaubt, 
so dass die Einbeziehung zusätzlicher Daten sinnvoll oder gar unverzichtbar ist. 

Die bekannteste und in praktisch jeder - und somit auch in der vorliegenden - 
Abhandlung zum Thema Triangulation zitierte Typologie stammt von Denzin 
(1970), der vor nunmehr über 40 Jahren erstmals eine Strukturierung dieses 
methodologischen Konstrukts vornahm und zwischen der Daten-, Forscher-, 
Theorien- und Methodentriangulation unterschied (vgl. dazu Settinieri in die- 
sem Band; vgl. auch Aguado 2014). Flick (2004) fügte später noch die Perspek- 
tiventriangulation hinzu, der jedoch nur ein bedingter Mehrwert zukommt, da 
allen zuvor genannten Typen die Betrachtung des Gegenstands aus mehreren 
Perspektiven inhärent ist. Dass im Rahmen einer empirischen Studie alle Typen 
berücksichtigt werden, kommt grundsätzlich eher selten vor. Dallinger und 
Jonkmann (in diesem Band) bieten allerdings ein gutes Beispiel für die Integra- 
tion von drei Typen, nämlich Forscher-, Daten- und Methoden-Triangulation. 

Ein seit langem weithin bekanntes Problem der Denzirischen Klassifikation 
ist ihre mangelnde definitorische Präzision sowie die fehlende Trennschärfe zwi- 
schen den verschiedenen Typen (vgl. dazu auch Birkner/Hackfort 2006). So ist zu 
beachten, dass grundsätzlich jede Methodentriangulation immer auch zugleich 
eine Datentriangulation ist, da mit verschiedenen Methoden zwingend auch 
verschiedene Daten erhoben werden. Von Datentriangulation spricht Denzin 
jedoch nur dann, wenn die Daten mit derselben Methode erhoben werden, also 
entweder zu verschiedenen Zeitpunkten oder von verschiedenen Probanden und 
Probandinnen. Problematisch an dieser Position ist, dass damit praktisch jede 
Longitudinalstudie, die dieselben Forschungsteilnehmer/innen zu verschiede- 
nen Zeitpunkten (zu Beginn, in der Mitte, am Ende der Studie) beobachtet oder 
befragt automatisch als Triangulationsstudie bezeichnet werden müsste, was je- 
doch an der Kernidee der Triangulation vorbeigeht, weil die als zentral benannten 
Funktionen - Validierung und Erkenntniserweiterung - so nicht erfüllt werden. 
Stattdessen dienen longitudinale Studien der Erfassung, Dokumentation und im 
Idealfall auch der Erklärung von Prozessen und Entwicklungen, und dafür sind 
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nun einmal Daten vonnöten, die zu verschiedenen Zeitpunkte erhoben und zuei- 
nander in Beziehung gesetzt, aber nicht miteinander trianguliert werden. 

Denzin zufolge sollen verschiedene Verfahren die eine richtige oder gültige Sicht 
auf den Gegenstand ermöglichen. Diese Position wurde u.a. von Silverman (1985) 
massiv kritisiert, der nicht nur gegen das Konstrukt einer ‚Master-Wirklichkeit‘ 
argumentiert, sondern auch gegen die hier zugrundeliegende Annahme, dass über- 
haupt ein Vollbild eines Gegenstands möglich sei. Hier stellt sich die Frage, wann 
ein Gegenstand vollständig erfasst ist bzw. wer dies entscheidet. In der einschlä- 
gigen forschungsmethodologischen Diskussion ist die Auffassung konsensfähig, 
dass es keine objektive Realität gibt, sondern dass diese individuell konstruiert bzw. 
interaktiv ko-konstruiert wird. Eine Aufgabe der qualitativen Forschung ist a) die 
Re-Konstruktion und b) die Interpretation dieser Konstruktionen. Trotz systema- 
tischem und methodisch kontrolliertem Vorgehen und dem Einsatz modernster 
Mitschnitttechnik bleiben Beobachtungen und Interpretationen durch Forschende 
ein Stück weit subjektiv. Die Glaubwürdigkeit empirischer Forschung steht daher 
in einem engen Zusammenhang mit der Anerkennung der Unvermeidbarkeit der 
Subjektivität und dem gezielten Versuch, reflektiert und angemessen mit dieser 
Problematik umzugehen und durch eine maximal transparente Dokumentation 
der Vorgehensweise Nachvollziehbarkeit und damit Intersubjektivität herzustellen. 
Der erkenntnistheoretische und -praktische Nutzen der Triangulationsstrategie ist 
hier offenkundig. Von Bedeutung ist auch die Frage nach dem Verhältnis und der 
Wechselwirkung der verschiedenen Daten, Forscher, Theorien oder Methoden: 
Handelt es sich um eine bloße Akkumulation oder findet eine bedeutsame Integra- 
tion statt? Generell wird in der einschlägigen Literatur gegen einen rein technokra- 
tischen Umgang mit Methoden argumentiert und die Position vertreten, dass die 
schlichte Aggregation von Informationen über einen Gegenstand nicht zwingend 
einen Mehrwert hat oder zu verbesserten Erkenntnissen führt. 

Als ein willkommener Nebeneffekt der Triangulation wird die daraus resul- 
tierende Demokratisierung von Forschung betrachtet, und zwar insofern als 
durch die angestrebte Gleichwertigkeit von Perspektiven - z.B. von Forschen- 
den und Forschungsteilnehmern oder von Vertreterinnen und Vertretern un- 
terschiedlicher theoretischer und/oder methodisch-methodologischer Ansätze 
- Hierarchien aufgebrochen oder gar aufgehoben werden. Auch das Postulat 
der Gleichwertigkeit methodischen Ansätze und der Methoden als Vorausset- 
zung für eine echte Triangulation wird in der einschlägigen Diskussion immer 
wieder betont, wobei ich den Aspekt der Parität von Methoden für weniger re- 
levant halte als den Aspekt der Angemessenheit (mehr dazu in Abschnitt 3). 
Gleichzeitig ist festzustellen, dass die bisher entwickelten und von Mayring 
(2001) zusammenfassend dargestellten Modelle - nämlich das Vorstudien-, das 
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Verallgemeinerungs-, das Vertiefungs- und das Triangulationsmodell (für eine 
ausführliche Darstellung der verschiedenen Modelle siehe Settinieri in diesem 
Band) - zwar alle mehrmethodisch, aber bis auf das gleichzeitig-synergierende 
Triangulationsmodell nicht alle triangulierend sind. In dem Vorstudienmodell, 
das auch als Phasenmodell der Methodenintegration bezeichnet wird, werden 
zunächst mittels qualitativer Verfahren Hypothesen generiert, die dann mittels 
quantitativer Verfahren getestet werden. Anders als in der einschlägigen Lite- 
ratur immer wieder moniert, bedeutet die vorgelagerte Generierung von Hy- 
pothesen aus meiner Sicht keineswegs, dass qualitativen Verfahren lediglich 
Hilfs- oder Dienstleistungsfunktionen zukommen. Im Gegenteil ist die syste- 
matische und methodisch kontrollierte Gewinnung von Hypothesen ein un- 
verzichtbarer inhaltlicher und methodischer Schritt, der die gesamte weitere 
Forschung bestimmt. Die zuvor skizzierte Wahrnehmung seitens der qualitativ 
Forschenden scheint mir auf einem vollkommen zu Unrecht bestehenden Min- 
derwertigkeitskomplex gegenüber quantitativen Ansätzen zu beruhen. 

Grundsätzlich lautet die angesichts der aktuell konstruktivistisch geprägten 
Sozialforschung vorherrschende Ansicht, dass die Realität nicht nur durch uns, 
sondern auch durch unsere Methoden konstituiert wird und dass kongruierende 
Ergebnisse somit eher unwahrscheinlich sind. Erkenntnisse sind also methoden- 
induziert oder zumindest methodenabhängig, und somit ist die Wahrscheinlich- 
keit, durch den Einsatz von mehreren Methoden Divergenzen zu erhalten, deutlich 
größer als die Aussicht auf Konvergenzen. Zusammenfassend lässt sich daher zu- 
mindest für die qualitative Forschung konstatieren, dass seit den 1980er Jahren 
das Ziel der Validierung mittels der Triangulationsstrategie immer seltener ver- 
folgt wird. Für den Fall, dass Validierung und damit Kongruenz angestrebt wird, 
ist allerdings zu beachten, dass sich unabhängig voneinander zwei oder mehrere 
Personen irren können. So warnt z.B. Lamnek: „Auch zwei übereinstimmende 
Befunde erhalten durch die Übereinstimmung keine höheren Wahrheitsgehalt; 
sie können gleichwohl beide falsch sein.“ Andererseits ist die Wahrscheinlichkeit, 
„dass zwei gleichlautende Erkenntnisse auf der Basis unterschiedlicher Methoden 
gleichsinnig falsch sind, [...] aufgrund der wahrscheinlichkeitstheoretisch gefor- 
derten multiplikativen Verknüpfung sehr gering, wenngleich ein solches Ereignis 
selbst nicht auszuschließen ist“ (Lamnek 2005: 285). 

Neben den zuvor genannten Einschränkungen auf theoretischer, konzepti- 
oneller und funktionaler Ebene gibt es aber auch eine Reihe ganz praktischer 
Schwierigkeiten mit der Anwendung der mehrmethodischen Triangulations- 
strategie. So erfordert sie zunächst einmal noch mehr Methodenkompetenz als 
die Anwendung einer Einzelmethode. Vor allem die Tatsache, dass die wissen- 
schaftstheoretischen Grundlagen einer jeden Methode gekannt werden müssen, 
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stellt Forschende, die in anderen wissenschaftlichen ‚Schulen‘ oder Paradigmen 
sozialisiert worden sind und somit bestimmte methodisch-methodologische Prä- 
ferenzen haben, vor große Herausforderungen. Es reicht also nicht, lediglich eine 
offene Einstellung gegenüber der Kombination oder Integration von mehreren 
methodischen Verfahren zu haben. Damit mehrmethodische Forschung tatsäch- 
lich einen echten Mehrwert haben kann, bedarf es einer entsprechenden Multi- 
Kompetenz. Dazu gehört die Fähigkeit, begründete Entscheidungen hinsichtlich 
der Kombinierbarkeit von Methoden treffen zu können und zu wissen, welche 
Verfahren in welcher Weise miteinander angewendet werden können. Eine nicht 
ausreichend reflektierte Kombination kann zu Fehlern bei der Anwendung füh- 
ren und falsche Ergebnisse und damit u.U. fehlerhafte Theoriebildungen zur Fol- 
ge haben. Hinzu kommt - wie Stefer (in diesem Band: 132) zutreffend feststellt 
- die Tatsache, dass Forschende „nicht nur in beiden Analysearten bewandert 
sein müssen, sondern auch die durch die Triangulation entstehende Komplexi- 
tät zu bewältigen haben. Schließlich ist nicht alles, was sich transformieren, mi- 
xen, triangulieren oder integrieren lässt, auch wirklich sinnvoll“. So sind bei der 
Kombination von Methoden verschiedener Paradigmen (between-method) ins- 
besondere auch deren jeweilige Eigengesetzlichkeiten sowie die jeweiligen Güte- 
kriterien zu beachten. Beispielsweise unterscheiden sich die Sampling-Strategien 
- d.h. die Art und Weise der Rekrutierung und Auswahl geeigneter Probanden 
bzw. Forschungsteilnehmerinnen - von quantitativen und qualitativen Verfahren 
erheblich voneinander, so dass nicht ohne Weiteres von der Validität von Daten 
auszugehen ist, die qualitativ erhoben und quantitativ ausgewertet worden sind. 
Die mit der Triangulationsstrategie verbundene Hoffnung auf einen Mehrwert 
an Qualität, Verlässlichkeit und Glaubwürdigkeit kann nur dann erreicht werden, 
wenn die Spezifika der jeweiligen Kombinationen angemessen bedacht werden. 
Zusammenfassend und mit Bezug auf die Herkunft des Terminus Triangu- 
lation sollte grundsätzlich eine eher enge bzw. strenge Definition vertreten wer- 
den, der zufolge sich die Strategie auf denselben Gegenstand beziehen muss. Im 
Unterschied zu Ivankova und Creswell (2009), die nur dann von Triangulation 
sprechen, wenn quantitative und qualitative Verfahren in einer Studie miteinan- 
der kombiniert werden würden, ist es aus meiner Sicht vollkommen irrelevant, 
ob es sich um within-method oder between- method Vorgehensweisen handelt. 


3. Angemessenheit - das Hauptkriterium für die 
Anwendung der Triangulationsstrategie 


Das im Folgenden diskutierte Gütekriterium der Angemessenheit bezieht 
sich auf den gesamten Forschungsprozess, d.h. von der Erhebung über die 
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Aufbereitung bis hin zur Auswertung und zur Interpretation von Daten. Diesem 
Zentralbegriff qualitativer Forschungen (vgl. auch Brüsemeister 2008) kommt 
in Bezug auf die Triangulationsstrategie meiner Auffassung nach eine besondere 
Gültigkeit zu. 

Wie in so vielen Bereichen trifft auch in der empirischen Forschung die 
Losung „Viel hilft viel!“ nur begrenzt zu. So ist der Einsatz möglichst vieler 
Methoden im Rahmen einer einzigen Studie nicht per se ein Wert (vgl. dazu 
z.B. Lamnek 2005: 291). Vielmehr muss die Anwendung mehrerer Methoden - 
genau wie die Anwendung einer einzelnen Methode - dem Gegenstand ange- 
messen sein, sich für die Beantwortung der Forschungsfrage eignen und dem 
übergeordneten Erkenntnisinteresse dienen. Die Entscheidung für die jeweilige 
methodische Auswahl muss immer entsprechend nachvollziehbar begründet 
werden - und zwar unabhängig von der Menge der Methoden. Es geht hier um 
die optimale Passung zwischen dem spezifischen Forschungsgegenstand und der 
Methode. Dabei ist grundsätzlich zu beachten, dass es selbstverständlich eine 
Vielzahl von Fragestellungen gibt, für die die Anwendung einer Einzelmethode 
nicht nur ausreichend, sondern auch besser für ihre Beantwortung geeignet ist. 
Allerdings ist das Kriterium der Angemessenheit insgesamt unscharf und bleibt 
somit weitgehend der Deutung jedes einzelnen Forschenden überlassen. Da es 
jedoch für den methodisch-methodologischen Diskurs unverzichtbar ist, ein 
konsensfähiges Begriffsverständnis zu haben, sollen im Folgenden diesbezügli- 
che Überlegungen angestellt werden. Sie basieren auf den Recherchen von Stefer 
(2013), der die einschlägige forschungsmethodologische Literatur im Hinblick 
auf ihre Thematisierung der Angemessenheit von Methoden ausgewertet und 
dabei eine Reihe von Faktoren identifiziert hat, von denen die mir am wichtigs- 
ten erscheinenden im Folgenden grob skizziert werden sollen. 

Zunächst einmal ist es unverzichtbar, dass der Gegenstand inklusive seiner 
Spezifika präzise benannt und definiert wird. Da die Auswahl von Metho- 
den auch von der verfolgten Fragestellung und ihrer Zielsetzung abhängig ist, 
müssen auch diese möglichst genau und eindeutig formuliert werden: Sollen 
verallgemeinerbare Ergebnisse oder dichte Einzelfallbeschreibungen geliefert 
werden? Welche Methoden angewendet werden (können), hängt natürlich 
nicht zuletzt auch von den Forschungsteilnehmer/innen und ihren Eigenschaf- 
ten, Kompetenzen und Bereitschaften ab sowie davon, welches Bild Forscher/ 
innen von ihnen haben und welche Erwartungen damit verknüpft sind. Sind 
es Erwachsene, Jugendliche oder Kinder? Handelt es sich um Muttersprachler 
oder um Nicht-Muttersprachler der untersuchten Zielsprache? Über welchen 
Bildungshintergrund verfügen die Probandinnen und Probanden? Können 
also z.B. Befragungen bzw. Introspektionen durchgeführt werden, oder muss 
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sich die Forschung auf Beobachtungen und die Dokumentation und Analyse 
von Produkten beschränken? So kann man als empirische Fremdsprachen- 
forscherin zwar ein ausgeklügeltes und aktuelle forschungsmethodologische 
Entwicklungen berücksichtigendes Design entwerfen, mit dem man z.B. inter- 
kulturelle Kompetenzen von Schülerinnen und Schülern in der Sekundarstufe, 
Fähigkeitsselbstkonzepte von Lehramtsstudierenden oder subjektive Lehrer- 
theorien über das selbstgesteuerten Lernen im Fremdsprachenunterricht um- 
fassend und vertiefend untersuchen kann. Wenn aber dabei die Protagonisten 
(also die Forschungsteilnehmer/innen) mit ihren kognitiven, affektiven oder 
sozialen Spezifika nicht in angemessener Weise berücksichtigt werden, ist das 
Scheitern solcher empirischer Studien vorprogrammiert. Hier kommt auch die 
von Appel und Rauin (in diesem Band) angesprochene Problematik der Inva- 
sivitätseffekte ins Spiel: Ein zu differenziertes Datenerhebungsdesign und die 
daraus resultierenden technischen Apparaturen können zu Verfälschungen, 
mindestens aber zu Verzerrungen und somit zu Beeinträchtigungen der Va- 
lidität einer Studie führen. Nicht zu unterschätzen ist auch die mögliche zeit- 
liche und je nach Thema ggf. auch psychische Belastung, die eine empirische 
Forschung für die Forschungsteilnehmer/innen bedeuten kann. Hier kommen 
also auch grundsätzliche ethische Fragen ins Spiel wie z.B.: Was kann/darf For- 
schungsteilnehmer/innen zugemutet werden (vgl. auch Viebrock 2009, Bach/ 
Viebrock 2012)? 

Welche Art von Forschung durchgeführt wird und welche empirischen Me- 
thoden angewendet werden, hängt ferner auch vom Interesse der Adressaten 
einer Untersuchung und ihrer Ergebnisse ab. Handelt es sich um ein wissen- 
schaftliches Fachpublikum, das an inhaltlichen und methodischen Details inte- 
ressiert ist und sich ggf. für die Replikation der vorgestellten Studie interessiert, 
oder handelt es sich z.B. um eine Zuhörerschaft, die einen allgemeinen Über- 
blick z.B. über ein ihnen eher unvertrautes Thema wünscht, mit dem sie sich 
u.U. nicht weiter befassen werden, so dass ein allgemeines methodisches Instru- 
mentarium ausreichend ist. 

Ein weiterer Faktor zur Beurteilung der Angemessenheit ist die Genese der 
Methode. So stellen Flick, von Kardorff und Steinke (2000: 22) fest, dass sich 
für fast jedes Verfahren zurückverfolgen lässt, „für welchen besonderen For- 
schungsgegenstand es entwickelt wurde. Ausgangspunkt war in der Regel, dass 
die vorhandenen Methoden für diesen spezifischen Gegenstand nicht geeignet 
waren.“ Die Kenntnis der Historie einer Methode ermöglicht nicht nur ein bes- 
seres Verständnis ihrer Besonderheiten, sondern eben auch eine Einschätzung 
hinsichtlich der Frage eines möglichen Transfers auf einen Gegenstand, für den 
sie nicht originär entwickelt worden ist. Insgesamt ist festzustellen, dass in den 
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meisten qualitativen Forschungen hochgradig individuelle Designs für die best- 
mögliche Erfassung des zu untersuchenden Gegenstands entworfen werden. 
Dies bringt zwar den Vorteil der optimalen Passung mit sich, eine solche Vorge- 
hensweise hat aber den Nachteil, dass Replikationsstudien nur sehr schwer oder 
ggf. gar nicht möglich sind. Dies ist eine in der forschungsmethodologischen 
Diskussion immer wieder formulierte Kritik an qualitativen Designs, insbeson- 
dere solchen, die triangulativ arbeiten. 

Ein im vorliegenden Zusammenhang zentraler Faktor betrifft das Verhältnis 
von Aufwand, Ressourcen und Nutzen. Insbesondere Forschungsnovizen - aber 
nicht nur sie - unterschätzen häufig den Aufwand, der mit der Durchführung, 
der Aufbereitung und der Auswertung z.B. von qualitativen Interviews, Video- 
mitschnitten fremdsprachenunterrichtlicher Interaktionen oder Erfassungen 
von L2-Erwerbsprozessen verbunden ist. Solche Fehleinschätzungen führen 
nicht selten zu den gefürchteten Datenfriedhöfen, d.h. große Mengen an erhobe- 
nen, z.T. sogar aufbereiteten Daten werden meist aus zeitlichen und ressourciel- 
len Gründen nicht ausgewertet und so zu ‚toten‘ Daten. Der immense Aufwand, 
der insbesondere in mehrmethodisch angelegten qualitativen Studien von den 
Forschenden betrieben werden muss, wird auch in nahezu allen Beiträgen im 
vorliegenden Sammelband thematisiert. Im Falle von Forscherteams kann der 
mit der Triangulationsstrategie verbundene Aufwand zwar verteilt, aber nicht 
grundsätzlich verringert werden. 

Aufgrund der Tatsache, dass sich die Verknüpfung qualitativer und quanti- 
tativer Daten immer mehr zur Normalität sozialwissenschaftlicher und damit 
auch fremdsprachendidaktischer Forschung entwickelt und sich gleichzeitig 
die technischen Möglichkeiten der Datenverarbeitung enorm verbessert haben, 
werden in letzter Zeit auch zunehmend Software-Programme zu computerge- 
stützten Analyse großer Datenmengen entwickelt und erfolgreich eingesetzt (vgl. 
die ausführliche Darstellung von Stefer, in diesem Band). Die Geschwindigkeit 
und Effizienz, mit der elektronisch erfasste Daten inzwischen verarbeitet werden 
können, ist beachtlich, aber auch sehr verführerisch, da grundsätzlich die Gefahr 
besteht, dass dann möglicherweise überflüssige Auswertungen nur deshalb vor- 
genommen werden, weil es möglich ist, nicht aber weil es sinnvoll ist. Die hier 
skizzierte Problematik ist nicht zu unterschätzen und sollte offener diskutiert 
werden, auch um gemeinsam Kriterien zu entwickeln, die als Entscheidungshil- 
fen fungieren können, ob und inwiefern sich der mit einem mehrmethodischen 
Vorgehen verbundene Aufwand (wie z.B. Einarbeitung in verschiedene Theori- 
en und Methoden, Einbeziehung verschiedener Kolleginnen und Kollegen, Kon- 
zeption und Durchführung longitudinaler Studien) tatsächlich lohnt, d.h. den 
erhofften Erkenntnisgewinn bringt. 
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Eng mit dem vorangegangenen Faktor verknüpft ist der folgende, nämlich 
die Forschungskompetenzen der jeweiligen Wissenschaftler. Wenngleich es ideal 
wäre, so kann sich selbstverständlich nicht jeder empirisch Forschende in allen 
für die Untersuchung eines Gegenstands relevanten bzw. geeigneten Methoden 
auskennen. Mögliche Konsequenzen könnten darin bestehen, dass man sich 
selbst weiterbildet und methodisch-methodologische Kompetenzen in bis dahin 
unbekannten Verfahren erwirbt oder dass man Experten - seien es Kolleginnen 
oder Kollegen, Experten aus einschlägigen Disziplinen oder universitäre For- 
schungsreferate - zu Rate zieht und um Unterstützung bittet. Außer bei Nach- 
wuchswissenschaftlern, die sich ihr methodologisch-methodisches Rüstzeug in 
der Regel erst noch erarbeiten und dabei häufig außerordentliche und hochaktu- 
elle Kompetenzen erwerben, werden in den meisten Fällen diejenigen Methoden 
ausgewählt und eingesetzt, hinsichtlich derer Forschende bereits über sichere 
Kenntnisse und Expertisen verfügen. Da wir es in der qualitativen Fremdspra- 
chenforschung mit komplexen Gegenständen zu tun haben, stellt sich in Bezug 
auf das Kriterium der Angemessenheit nicht zuletzt auch die Frage nach der 
Offenheit der Methode: Ermöglichen sie a) die ganzheitliche Erfassung des Ge- 
genstands und b) das Hinterfragen von Vorannahmen der Forschenden? Oder 
erfassen sie nur einen Ausschnitt des Gegenstands, so dass die Einbeziehung 
weiterer Methoden indiziert ist? 

Resümierend lässt sich festhalten, dass alle genannten Faktoren hinsichtlich 
der Frage nach der Angemessenheit bzw. der Passung von Methoden für eine 
empirische Forschung zu berücksichtigen sind, wobei den Faktoren Gegenstand 
und Fragestellung höchste theoretische Priorität zukommt, während den Fakto- 
ren Eigenschaften von Forschungsteilnehmerinnen und -teilnehmern, Verhältnis 
von Aufwand, Ressourcen und Nutzen sowie methodisch-methodologische Kom- 
petenzen der Forschenden höchste praktische Priorität beizumessen ist. 


4. Fazit 


Die Anwendung der Triangulationsstrategie ist Ausdruck eines gewachsenen 
Bewusstseins über die Relativität von Perspektiven, d.h. seitdem anerkannt wur- 
de, dass nicht von einer objektiven Realität ausgegangen werden kann und es 
immer mehrere Perspektiven auf die Wirklichkeit und ihre Gegenstände gibt, 
erscheint es sinnvoll und wichtig, diese auch zu berücksichtigen, um eine halb- 
wegs adäquate Rekonstruktion des jeweils fokussierten Wirklichkeitsausschnitts 
vorzunehmen. 

Ein Ziel des vorliegenden Beitrags bestand darin zu zeigen, dass der Ein- 
satz mehrerer Methoden innerhalb einer Forschung und die Anwendung der 
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Triangulationsstrategie nicht zwingend dasselbe sind. Im Rahmen einer Untersu- 
chung mehrere Methoden, Verfahren etc. kumulativ einzusetzen, ohne sich über 
deren genaue Funktion und über ihre Wechselwirkungen Gedanken zu machen, 
kann zwar - vielleicht aber nur zufällig - zu relevanten Ergebnissen führen, eine 
wissenschaftliche Vorgehensweise im Sinne einer systematischen, begründeten 
und kontrollierten Anwendung forschungsmethodischer Verfahren ist damit 
jedoch nicht erreicht. Was zur Steigerung der Qualität empirischer Studien bei- 
trägt, sind transparente, nachvollziehbare, strukturierte und fundierte Entschei- 
dungen hinsichtlich der Auswahl und des Einsatzes von Methoden, und zwar 
einerseits sowohl bei der Datenerhebung, bei der Datenaufbereitung als auch bei 
der Datenauswertung und andererseits sowohl bei der Anwendung einer ein- 
zelnen Methode als auch beim Einsatz mehrerer Methoden. Grundsätzlich gilt 
jedoch, dass solange Grundprinzipien wie Angemessenheit, Systematizität und 
Nachvollziehbarkeit eingehalten werden, kein Verfahren wissenschaftlicher als 
ein anderes ist. Die methodologische Diskussion um eine systematisierte Kom- 
bination steht erst am Anfang: Sie muss weitergehen! 

Falls Validierung überhaupt möglich ist, dann kann sie nur durch die Anwen- 
dung der Triangulationsstrategie erfolgen. Aus meiner Sicht besteht die Funk- 
tion der Triangulation in dem Versuch, verbesserte Erkenntnisse zu erzielen. 
Dass dieser Versuch zeitweise zu einer Modeerscheinung degeneriert ist - wie es 
z.B. Lamnek (2005) beklagt -, mag zwar stimmen, ist aber kein Grund, die For- 
schungsstrategie als Ganze in Zweifel zu ziehen. Allerdings ist zu beachten, dass 
unterschiedliche Gegenstände unterschiedliches Triangulationspotenzial haben, 
d.h. nicht alle Fragestellungen lassen alle Triangulationstypen zu. 

Der kombinierte Einsatz von mehreren Methoden ist eine inzwischen so 
weit verbreitete und populäre Vorgehensweise in der empirischen Forschung, 
dass Tashakkori/Teddlie (2010: ix) von einem third methodological movement 
sprechen. Ob und wie sich diese Bewegung weiterentwickelt, bleibt abzuwarten. 
Wenn allerdings nicht in absehbarer Zeit einige der immer wieder aufgewor- 
fenen kritischen Aspekte bearbeitet werden, steht zu befürchten, dass es keine 
konstruktive Weiterentwicklung geben wird. So bedarf u.a. die folgende Frage 
einer Klärung: Welche Methoden können/dürfen miteinander kombiniert wer- 
den, um einen möglichst großen Erkenntnisgewinn zu bieten? 

Ein in jüngster Zeit immer wieder formuliertes Desiderat betrifft die Bildung 
von Forschungsverbünden oder zumindest die kollegiale bzw. kooperative Er- 
stellung und Nutzung gemeinsamer Korpora oder Datenbanken. Hier geschieht 
leider nach wie vor viel zu wenig, was nicht zuletzt damit zusammenhängt, dass 
viele empirische Daten im Rahmen von Qualifikationsarbeiten erhoben und 
aufbereitet werden, die von den Autorinnen und Autoren dann als ‚ihre‘ Daten 
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betrachtet werden. Dies ist angesichts des enormen Aufwands, der damit ver- 
bunden sein kann, nachvollziehbar. Für die Weiterentwicklung empirischer Dis- 
ziplinen wie der Fremdsprachenforschung wäre die ‚polyvalente‘ Nutzung von 
bereits vorhandenen Daten jedoch ein enormer Fortschritt, nicht zuletzt des- 
halb, weil er dazu beiträgt, Zeit und Kosten zu sparen. Es soll an dieser Stelle 
jedoch nicht verschwiegen werden, dass die Schaffung gemeinsamer Korpora 
z.B. aufgrund der nicht allen Bereichen gleichermaßen standardisierten Daten- 
aufbereitung (vgl. z.B. das Problem unterschiedlicher Transkriptionskonventio- 
nen) kein trivialer Prozess ist, der meiner Meinung dennoch angegangen werden 
sollte, um langfristig die vorhandenen Ressourcen besser nutzen zu können. 

Unterrichtsbeobachtungen sind aufwendig und komplex, ermöglichen jedoch 
Einsichten in interaktive Lehr- und Lernprozesse, die auf keine andere Weise zu 
gewinnen sind. Klieme und Rakoczy (2008: 225) fassen das Ziel der Unterrichts- 
forschung folgendermaßen zusammen: „Um wissenschaftliche Erkenntnisse und 
praktisch handhabbares Wissen zu erzeugen, bedarf es einer systematischen 
Beobachtung und Beschreibung der Interaktionsprozesse von Lehrern und 
Schülern sowie der Analyse ihres Zusammenhangs mit Schülermerkmalen 
(Lernvoraussetzungen, -strategien und -ergebnissen) und Lehrermerkmalen (z.B. 
allgemein-pädagogischem und fachdidaktischem Wissen), kurz: einer empiri- 
schen Unterrichtsforschung“. Inzwischen gibt es zahlreiche technische Möglich- 
keiten, die eine solche faktorenkomplexe Forschung unterstützen können. Die im 
Zusammenhang z.B. mit der Videografie inzwischen mögliche Perspektivenviel- 
falt, d.h. der Blick auf dieselbe Situation aus verschiedenen Perspektiven, kann 
einen echten Erkenntnisgewinn ermöglichen - hier erscheint die Anwendung 
der Triangulationsstrategie also besonders fruchtbar. Das vorhandene Potenzial 
wird in den Beiträgen von Seifert sowie von Appel und Rauin (beide in diesem 
Band) überzeugend dargestellt. Zusätzlich zu den verschiedenen Perspektiven 
können auch zusätzliche Daten (Lautes Erinnern, Befragungen, Tests) erhoben 
werden, die zu einem besseren Verständnis der Videodaten beitragen und aus 
meiner Sicht eine hervorragende Möglichkeit darstellen, die beiden Funktionen 
der Triangulation - Validierung und Vertiefung - miteinander zu kombinieren. 
Die beispielsweise im Falle der Kombination von online oder offline durchge- 
führten Beobachtungen und anschließenden retrospektiven Befragungen (lautes 
Erinnern bzw. stimulated recall) ermöglichte Ermittlung der Innensicht von For- 
schungsteilnehmern bzw. die Rekonstruktion ihrer Wirklichkeitskonstruktion 
lassen Erkenntnisse zu, die mittels einer Einzelmethode nicht erzielbar wären. 

In Bezug auf die in der Fremdsprachenforschung in jüngster Zeit vermehrt 
durchgeführten videobasierten Beobachtungsstudien teile ich daher das von 
Appel und Rauin (in diesem Band: 76) formulierte Fazit, dass sie „nicht nur 
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Möglichkeiten zur Triangulation eröffnen, sondern sie in Gestalt der Verknüp- 
fung und Kombination von Daten, der Variation von Instrumenten und der 
Beteiligung mehrerer Forscher regelrecht erfordern, um Beobachtungsdaten in 
ihrem Aussagegehalt aufwerten zu können‘, wobei eine bewusste und reflektierte 
Auseinandersetzung mit den Verfahren unverzichtbar ist. 
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